VNGRS tarafından geliştirilen yerli yapay zeka modeli Kumru, deneyimlemek isteyen herkes için ücretsiz bir şekilde kullanıma sunuldu. Ülkemizdeki sınırlı yapay zeka modellerinden biri olan Kumru, tamamen Türkçe eğitilmesi ile rakiplerinden ayrılıyor.
7.4 milyar parametreye sahip olan Kumru, Türkçe’nin haricinde İngilizce yanıtlar da verebiliyor. Ayrıca model, kodlama alanında her ne kadar iddialı olmasa da basit problemlere doğru yanıtlar verebiliyor.
Modelin geliştiricisi VNGRS tarafından paylaşılan bilgilere göre Kumru, 8.192 token’lık bağlam uzunluğuna sahip. Bu da 20 A4 sayfasının tek seferde model tarafından anlaşılabildiği anlamına geliyor. Şirket, modelin genel kullanımdan ziyade kurum içi kullanımlara yönelik temel bir LLM olarak tasarlandığını belirtirken tüketici sınıfı GPU’larda bile kullanımı mümkün kılarak bu hedefi gerçekleştirdiklerini aktarıyor.

45 günlük ön eğitim aşamasında Nvidia imzalı H100 ve H200 GPU’lar ile eğitilen Kumru, 500 GB temizlenmiş ve tekilleştirilmiş metinler üzerinde ön eğitimini tamamladı. Daha sonrasında model 300 milyar token’a maruz bırakılarak 1 milyon örnek ile ince ayarları tamamlandı.
Mimari olarak dünyanın önde gelen açık kaynak kodlu yapay zeka modellerinden ilham alan Kumru; Mistral-v0.3’e dayanıyor. Çoklu görev, optimizasyon ve öğrenme hızı gibi konularda ise geliştiriciler Meta imzalı LLama-3 modelinden yararlanmış durumda.
Kumru diğer açık kaynak modeller arasından nasıl ayrılıyor?
| Model | VRAM gereksinimi | GPU maliyeti |
| Kumru-7B | 14.8 GB | 2.000 dolar |
| LLama-3.3-70B | 140 GB | 60.000 dolar |
| Gemma-3-27B | 54 GB | 30.000 dolar |
| Qwen-2-72B | 144 GB | 60.000 dolar |
| DeepSeek-R1 | 1370 GB | 320.000 dolar |
7 milyar parametreye sahip Kumru modelinin bir de 2 milyar parametreli bir kardeşi bulunuyor. Açık kaynak kodlu Kumru-2B modeli, 8.192 token bağlam uzunluğuna sahip. Modelin HuggingFace platformu üzerinden geliştiricilerle paylaşıldığının da altını çizelim. Kumru’yu denemek için buradaki web sitesini ziyaret edebilirsiniz.