Meta bugün itibariyle Llama 3.1 405B‘yi piyasaya sürdü. Şirketin iddiasına göre bu yapay zeka modeli OpenAI ve Anthropic gibi modellerle rekabet ediyor.
Deneysel değerlendirmemiz, amiral gemisi modelimizin GTP-4, GPT-4o ve Claude 3.5 Sonnet dahil olmak üzere bir dizi görevde önde gelen temel modellerle rekabet ettiğini gösteriyor.
Meta
Ayrıca Meta bu model için “dünyanın en büyük ve en yetenekli açık temel modeli” iddiasını sürdürüyor. Bu modelin düz yazı, sohbet yanıtları ve daha fazlasını ürettiği öne çıkıyor.
Meta’nın Llama 3.1 405B modeli, eğitimden geçmişti
Model, 16.000 Nvidia H100 GPU kullanılarak 15 trilyondan fazla token üzerinde eğitimden geçmişti. Bu noktada Meta açıklamasına göre 405 milyar parametreli modelin eğitimi toplamda 30,84 milyon GPU saat sürdü ve yaklaşık 11 ton CO2 emisyonu üretti.

Geçtiği eğitimler göz önüne alındığında Meta’nın yapay zeka modeli, OpenAI ve Anthropic’in önünde bir model. Bu noktada karşılaştırma olarak OpenAI GPT-4, 1,8 trilyon parametre büyüklüğüne sahip.
Llama 3.1
Llama 3 için birinci nokta güncelleme geldi. Bu modelde ve öncekilerde içlerinde İngilizce, Almanca ve Fransızca’nın yer aldığı sekiz dil için 128.000 token bağlam penceresi desteği var.
Bu sayıyı modelin kısa süreli belleği gibi düşünmek mümkün. Dolayısıyla bağlam penceresi ne kadar büyük olursa yanıt oluştururken o kadar fazla bilgi tutar.
Meta, Llama için hedeflerini açıkladı
Meta, güncellemeler ve karşılaştırmalar hakkında detayları iletirken yapay zeka modeli için hedefleri de açıkladı. Bu doğrultuda şu noktalar öne çıkıyor:
Llama modellerinin her zaman, harici araçların çağrılması da dahil olmak üzere çeşitli bileşenleri düzenleyebilen genel bir sistemin parçası olarak çalışması amaçlanmıştır.
Vizyonumuz, geliştiricilere vizyonlarına uygun özel teklifler tasarlama ve oluşturma esnekliği sağlayan daha geniş bir sisteme erişim sağlamak için temel modellerin ötesine geçmektir.
Meta
Meta, gelişime oldukça açık ve bunu yalnızca şirket içinde sürdürmek istemiyor. Bu noktada vizyonunun bir parçası olarak diğer şirketlerden ve topluluklardan yorum talep ediyor. Llama Stack adını verdiği projeyi GitHub‘a ekleyip eleştirileri toplaması, vizyonunun bir parçası olarak öne çıkıyor.
Mark Zuckerberg, yapay zeka için açık kaynak vurgusu yapıyor

CEO Mark Zuckerberg, Salı günü yayınlanan açık kaynak kodlu Linux çekirdeği için bir mektup yazmıştı. Bu mektupta YZ için de açık kaynak vurgusu yaptı.
Linux popülerlik kazandı – başlangıçta geliştiricilerin kodunu istedikleri gibi değiştirmelerine izin verdiği ve daha uygun fiyatlı olduğu için ve zamanla daha gelişmiş, daha güvenli hale geldiği ve herhangi bir kapalı Unix’ten daha fazla yeteneği destekleyen daha geniş bir ekosisteme sahip olduğu için. Yapay zekanın da benzer bir şekilde gelişeceğine inanıyorum.
CEO Mark Zuckerberg