Alibaba’nın Qwen ekibi QwQ-32B-Preview isimli yapay zeka modelini yayınladı. Bu model 32,5 milyar parametre içeriyor. Bunun yanında 32 bin kelime uzunluğundaki istemleri alabiliyor. OpenAI’ın o1-preview ve o1-mini modellerine göre bu ölçütlerle daha iyi performans gösteriyor.
Buradaki parametre farkları, ilgili modelin diğerine göre daha iyi performans sergilediğini gösteren nicel belirteçler. Dolayısıyla daha fazla parametresi olan model iyi performans gösterir. Fakat bu noktada OpenAI, modelleri için parametre sayısını açıklamıyor.
Alibaba, yapay zeka modeliyle testleri başarıyla geçiyor
Alibaba, yeni modeliyle AIME ve MATH testlerinde OpenAI’nin o1 modellerini geride bıraktığını saptadı. AIME, performans değerlendirme için öne çıkarken MATH ise kelime problemi olarak kullanılıyor.
İlgili testlerin sonucuyla QwQ-32B-Preview, muhakeme yapabilir ve mantık bulmacalarını çözebilir durumda. Ayrıca zorlayıcı matematik sorularını yanıtlıyor. Fakat bir blog yazısında sağduyulu muhakeme gerektiren görevlerde modelin geride kaldığı yazıyor. Ayrıca model bir anda konuştuğu dilin dışında farklı bir dile geçebilir.
QwQ-32B-Preview, kendini denetliyor
QwQ-32B-Preview, kendini kontrol eden bir model olarak da öne çıkıyor. Bu sayede doğru yanıtlar verme noktasında daha etkili oluyor.
Diğer taraftan çözümlere ulaşmak uzun sürüyor. Bu noktada o1 ile benzerlik gösteren model, cevapları planlayarak iletiyor ve bunları bir dizi eylemle açıklıyor.