Alibaba, OpenAI o1'e meydan okuyacak yapay zeka modelini yayınladı

Alibaba’nın Qwen ekibi QwQ-32B-Preview isimli yapay zeka modelini yayınladı. Bu model 32,5 milyar parametre içeriyor. Bunun yanında 32 bin kelime uzunluğundaki istemleri alabiliyor. OpenAI’ın o1-preview ve o1-mini modellerine göre bu ölçütlerle daha iyi performans gösteriyor.

Buradaki parametre farkları, ilgili modelin diğerine göre daha iyi performans sergilediğini gösteren nicel belirteçler. Dolayısıyla daha fazla parametresi olan model iyi performans gösterir. Fakat bu noktada OpenAI, modelleri için parametre sayısını açıklamıyor.

Alibaba, yapay zeka modeliyle testleri başarıyla geçiyor

Alibaba, yeni modeliyle AIME ve MATH testlerinde OpenAI’nin o1 modellerini geride bıraktığını saptadı. AIME, performans değerlendirme için öne çıkarken MATH ise kelime problemi olarak kullanılıyor.

İlgili testlerin sonucuyla QwQ-32B-Preview, muhakeme yapabilir ve mantık bulmacalarını çözebilir durumda. Ayrıca zorlayıcı matematik sorularını yanıtlıyor. Fakat bir blog yazısında sağduyulu muhakeme gerektiren görevlerde modelin geride kaldığı yazıyor. Ayrıca model bir anda konuştuğu dilin dışında farklı bir dile geçebilir.

QwQ-32B-Preview, kendini denetliyor

QwQ-32B-Preview, kendini kontrol eden bir model olarak da öne çıkıyor. Bu sayede doğru yanıtlar verme noktasında daha etkili oluyor.

Diğer taraftan çözümlere ulaşmak uzun sürüyor. Bu noktada o1 ile benzerlik gösteren model, cevapları planlayarak iletiyor ve bunları bir dizi eylemle açıklıyor.

Alibaba, OpenAI o1’e meydan okuyacak yapay zeka modelini yayınladı

Alibaba, yapay zeka modeliyle testleri başarıyla geçiyor

QwQ-32B-Preview, kendini denetliyor

Bir yanıt yazın Yanıtı iptal et

Alibaba, OpenAI o1’e meydan okuyacak yapay zeka modelini yayınladı

Alibaba, yapay zeka modeliyle testleri başarıyla geçiyor

QwQ-32B-Preview, kendini denetliyor

Bir yanıt yazın Yanıtı iptal et

İlgili İçerikler

Meta, tepki gören yapay zeka görsel oluşturma özelliğini kapattı

OpenAI, kendi tarayıcısı ChatGPT Atlas’ı kapatma kararı aldı

SpaceXAI, kurumsallara odaklanan yeni modeli Grok 4.5’i tanıttı

OpenAI, yeni ses modeli GPT-Live’ı kullanıma sundu