Açık Kaynak Araştırma & Geliştirme

Araştırmamız

Akademik araştırma temelli, açık kaynak ekosistem-uyumlu çalışmalar. Türkçe NLP, multi-modal AI ve kanıt-bazlı karar destek alanlarında geliştirdiğimiz metodoloji, veri seti ve araçları kamuya açıyoruz.

Odak Alanlarımız

Türkçe NLP

Türkçe doğal dil işleme — soru-cevap, özetleme, sınıflandırma — alanında metodoloji ve veri seti çalışmaları.

Açık Kaynak Veri Setleri

Türk araştırma topluluğunun ihtiyaç duyduğu açık veri kaynakları üretimi ve kamuya açma.

Multi-modal AI

Görüntü + metin + zaman serisi gibi birden fazla veri tipinin birlikte modellenmesi üzerine çalışmalar.

Kanıt-Bazlı Karar Destek

Kurumsal AI mimari tercihlerinde (RAG, fine-tuning, hibrit) sayısal karşılaştırmalı kanıt üretimi.

Yayın Süreci Notu

Belirli bazı araştırmalarımız şu anda hakemli yayın değerlendirme sürecindedir; metodoloji ve veri detayları yayın süreci tamamlanana kadar paylaşılamamaktadır. Tamamlanan çalışmalarımız ise zaman içinde MIT lisansı ile aşağıda yayımlanacaktır. Spesifik bir konu için doğrudan iletişime geçebilirsiniz.

Düşünce Liderliği

AITech Okumaları

En yeni AI yayınlarının (EMNLP, ACL, NeurIPS 2025) üretim ortamı için ne ifade ettiğini sorguladığımız okuma serisi — LinkedIn'de açık paylaşım.

#6

On-Prem · Privacy

On-Premise LLM Privacy

EMNLP 2025: "Veriyi korudun, peki ya modeli?" — middle-path on-prem deployment.

#5

Edge · SLM

Edge SLM Strategy

ACL 2025 (Cambridge / Xiaomi): Küçük dil modelleri yeterli mi?

#4

Long Context

Context Length Penalty

EMNLP 2025: 1M token tuzağı — LLM'lerde dikkat nereye kayboluyor?

#3

Interpretability

Word Embeddings Linear Dynamics

NeurIPS 2025 (UC Berkeley + Google DeepMind): Word2Vec aslında ne öğreniyor?

#2

Cost · Reliability

syftr · Pareto-Optimal GenAI

DataRobot teknik raporu: Güvenilirlik sağlandı, peki ya maliyet?

#1

LegalTech · QA

Legal AI Reliability

Thomson Reuters Labs: Hukuk yapay zekasında dayanaklılık sorunu.

LinkedIn'de Tüm Seri

Açık Kaynak Projelerimiz

Türkçe NLP veri setleri, akademik veri kazıma, sektör verisi analizi — açık kaynak ekosisteme yaptığımız katkılar.

Kimlik-Av-Tespiti

Oltalama tespiti için hibrit ve çok modlu mimarilerin sistematik analizi.

GitHub'da incele →

Nutuk-Turkce-NLP-Dataset

Türkçe NLP araştırmaları için açık veri seti.

GitHub'da incele →

akademik-veri-kazima

arXiv ve Semantic Scholar API'leri ile bilimsel literatür kazıma araçları.

GitHub'da incele →

Taskin-tahmin-modeli

Zaman serisi + görüntü özellikleriyle multi-modal taşkın tahmini.

GitHub'da incele →

ibb-toplu-tasima-veri-analizi

Toplu taşıma verileri ve GTFS entegrasyonu ile veri analizi.

GitHub'da incele →

python-veri-bilimi-temel-notlar

Veri bilimi için Python — NumPy, Pandas, Matplotlib eğitim materyali.

GitHub'da incele →

Tüm GitHub Profili

Açık Bilim · Kanıt-Bazlı Karar

Kurumsal AI çözümleriniz için mimari kararları kanıt-bazlı değerlendirelim.

Bize Ulaşın Çalışmalarımız