Araştırmamız
Akademik araştırma temelli, açık kaynak ekosistem-uyumlu çalışmalar. Türkçe NLP, multi-modal AI ve kanıt-bazlı karar destek alanlarında geliştirdiğimiz metodoloji, veri seti ve araçları kamuya açıyoruz.
Odak Alanlarımız
Türkçe NLP
Türkçe doğal dil işleme — soru-cevap, özetleme, sınıflandırma — alanında metodoloji ve veri seti çalışmaları.
Açık Kaynak Veri Setleri
Türk araştırma topluluğunun ihtiyaç duyduğu açık veri kaynakları üretimi ve kamuya açma.
Multi-modal AI
Görüntü + metin + zaman serisi gibi birden fazla veri tipinin birlikte modellenmesi üzerine çalışmalar.
Kanıt-Bazlı Karar Destek
Kurumsal AI mimari tercihlerinde (RAG, fine-tuning, hibrit) sayısal karşılaştırmalı kanıt üretimi.
Yayın Süreci Notu
Belirli bazı araştırmalarımız şu anda hakemli yayın değerlendirme sürecindedir; metodoloji ve veri detayları yayın süreci tamamlanana kadar paylaşılamamaktadır. Tamamlanan çalışmalarımız ise zaman içinde MIT lisansı ile aşağıda yayımlanacaktır. Spesifik bir konu için doğrudan iletişime geçebilirsiniz.
AITech Okumaları
En yeni AI yayınlarının (EMNLP, ACL, NeurIPS 2025) üretim ortamı için ne ifade ettiğini sorguladığımız okuma serisi — LinkedIn'de açık paylaşım.
On-Premise LLM Privacy
EMNLP 2025: "Veriyi korudun, peki ya modeli?" — middle-path on-prem deployment.
Edge SLM Strategy
ACL 2025 (Cambridge / Xiaomi): Küçük dil modelleri yeterli mi?
Context Length Penalty
EMNLP 2025: 1M token tuzağı — LLM'lerde dikkat nereye kayboluyor?
Word Embeddings Linear Dynamics
NeurIPS 2025 (UC Berkeley + Google DeepMind): Word2Vec aslında ne öğreniyor?
syftr · Pareto-Optimal GenAI
DataRobot teknik raporu: Güvenilirlik sağlandı, peki ya maliyet?
Legal AI Reliability
Thomson Reuters Labs: Hukuk yapay zekasında dayanaklılık sorunu.
Açık Kaynak Projelerimiz
Türkçe NLP veri setleri, akademik veri kazıma, sektör verisi analizi — açık kaynak ekosisteme yaptığımız katkılar.
Kimlik-Av-TespitiOltalama tespiti için hibrit ve çok modlu mimarilerin sistematik analizi.
GitHub'da incele →
Nutuk-Turkce-NLP-DatasetTürkçe NLP araştırmaları için açık veri seti.
GitHub'da incele →
akademik-veri-kazimaarXiv ve Semantic Scholar API'leri ile bilimsel literatür kazıma araçları.
GitHub'da incele →
Taskin-tahmin-modeliZaman serisi + görüntü özellikleriyle multi-modal taşkın tahmini.
GitHub'da incele →
ibb-toplu-tasima-veri-analiziToplu taşıma verileri ve GTFS entegrasyonu ile veri analizi.
GitHub'da incele →
python-veri-bilimi-temel-notlarVeri bilimi için Python — NumPy, Pandas, Matplotlib eğitim materyali.
GitHub'da incele →
Açık Bilim · Kanıt-Bazlı Karar
Kurumsal AI çözümleriniz için mimari kararları kanıt-bazlı değerlendirelim.