Yerli yapay zeka modeli Kumru, kullanıma sunuldu

VNGRS tarafından geliştirilen yerli yapay zeka modeli Kumru, deneyimlemek isteyen herkes için ücretsiz bir şekilde kullanıma sunuldu. Ülkemizdeki sınırlı yapay zeka modellerinden biri olan Kumru, tamamen Türkçe eğitilmesi ile rakiplerinden ayrılıyor.

7.4 milyar parametreye sahip olan Kumru, Türkçe’nin haricinde İngilizce yanıtlar da verebiliyor. Ayrıca model, kodlama alanında her ne kadar iddialı olmasa da basit problemlere doğru yanıtlar verebiliyor.

Modelin geliştiricisi VNGRS tarafından paylaşılan bilgilere göre Kumru, 8.192 token’lık bağlam uzunluğuna sahip. Bu da 20 A4 sayfasının tek seferde model tarafından anlaşılabildiği anlamına geliyor. Şirket, modelin genel kullanımdan ziyade kurum içi kullanımlara yönelik temel bir LLM olarak tasarlandığını belirtirken tüketici sınıfı GPU’larda bile kullanımı mümkün kılarak bu hedefi gerçekleştirdiklerini aktarıyor.

45 günlük ön eğitim aşamasında Nvidia imzalı H100 ve H200 GPU’lar ile eğitilen Kumru, 500 GB temizlenmiş ve tekilleştirilmiş metinler üzerinde ön eğitimini tamamladı. Daha sonrasında model 300 milyar token’a maruz bırakılarak 1 milyon örnek ile ince ayarları tamamlandı.

Mimari olarak dünyanın önde gelen açık kaynak kodlu yapay zeka modellerinden ilham alan Kumru; Mistral-v0.3’e dayanıyor. Çoklu görev, optimizasyon ve öğrenme hızı gibi konularda ise geliştiriciler Meta imzalı LLama-3 modelinden yararlanmış durumda.

Kumru diğer açık kaynak modeller arasından nasıl ayrılıyor?

Model	VRAM gereksinimi	GPU maliyeti
Kumru-7B	14.8 GB	2.000 dolar
LLama-3.3-70B	140 GB	60.000 dolar
Gemma-3-27B	54 GB	30.000 dolar
Qwen-2-72B	144 GB	60.000 dolar
DeepSeek-R1	1370 GB	320.000 dolar

7 milyar parametreye sahip Kumru modelinin bir de 2 milyar parametreli bir kardeşi bulunuyor. Açık kaynak kodlu Kumru-2B modeli, 8.192 token bağlam uzunluğuna sahip. Modelin HuggingFace platformu üzerinden geliştiricilerle paylaşıldığının da altını çizelim. Kumru’yu denemek için buradaki web sitesini ziyaret edebilirsiniz.