Amazon Web Services (AWS), Salı günü düzenlediği re:Invent etkinliğinde çok modlu üretken yapay zeka modelleri ailesi Nova’yı duyurdu. Nova içinde Micro, Lite, Pro ve Premier olmak üzere dört farklı metin üreten model yer alıyor. Bu modellerden ilk üçü önümüzdeki hafta AWS müşterilerine sunulacak. Premier ise 2025’in başlarında gelecek.
Bu dört YZ modelinin yanında görüntü oluşturma modelleri de öne çıkıyor. Bu noktada Nova Canvas ve Nova Reel var. Konuyla ilgili Amazon CEO’su Andy Jassy, modeller konusunda iddiasını dile getiriyor.
Kendi sınır modellerimiz üzerinde çalışmaya devam ettik ve bu sınır modelleri son dört ila beş ayda muazzam bir ilerleme kaydetti. Eğer biz onlardan değer buluyorsak siz de muhtemelen onlardan değer bulursunuz diye düşündük.
Amazon CEO’su Andy Jassy
Nova modelleri 15 dilde metin üretiyor
15 dille optimize bir şekilde çalışan Nova modelleri, metin üretme noktasında yetenekleriyle öne çıkıyor. Bu nokta Micro, en hızlı çalışıp metin çıktısı verebilen bir model. Lite ise görüntü, video ve metin girişlerini alıyor. Pro, doğruluk noktasında güvenilir bir model. Son olarak Premier, karmaşık işleri algılayıp doğru yanıtlar üretiyor.
Her ne kadar Pro, Premier ve Lite benzer çalışmalar gösteriyor olsa da AWS’nin amacı Premier’i daha farklı konuma getirmek. Bu noktada kendi başına kullanılmasından daha çok özel modeller oluşturmaya yönelik bir “öğretmen” gibi görüyor.
AWS Nova’yı hızlı ve ulaşılabilir yapmaya çalışıyor
Modellere ait sınırlar ise Micro’da 128 bin token, yaklaşık 100 bin kelime işlemeye karşılık geliyor. Lite ve Pro 300 bin token ile 225 bin kelimeye çıkıyor. Ayrıca 15 bin satır kod ve 30 dakikalık görüntüye karşılık geliyor.
AWS’nin amacı ise 2 milyondan fazla tokena kadar genişlemek. Bunu yaparken CEO Jassy’nin de aktarımıyla düşük maliyet hedefi öne çıkıyor.
Canvas ve Reel alanlarında komutlara göre hareket ediyor
Nova Canvas ile kullanıcılar komutlar girerek görüntüler oluşturur ve düzenler. Bu noktada arka plan kaldırma, reelları altı saniyeye kadar uzatma ya da kamera hareketini değiştirme gibi birçok komut öne çıkıyor.
Nova Reel şu anda altı saniyelik videoları üç dakikada hazırlıyor. AWS’nin amacı ise iki dakikalık videolar üretebilmek.
AWS bir blog yazısında, Nova’nın yanlış bilgi vermesini ve çocuk istismarına yönelik içerikler üretmesini engellediğini söylüyor. Ayrıca farklı risklere dair yanlış bilgi vermiyor ve yaygınlaştırmıyor.
Speech-to-Speech ve Any-to-Any
Bir sonraki aşamada AWS, 2025’in ilk çeyreğini vurgulayarak, Speech-to-Speech ve Any-to-Any üzerine çalışıyor. Speech-to-Speech’te konuşmaları alarak ton ve ritim gibi ipuçlarını yorumlayıp insan benzeri sesler üretecek.
Any-to-Any‘de ise çevirmenler, içerik üreticileri ve yapay zeka asistanlarına yönelik uygulamalar planlıyor. Bu noktada kişiler metin, video, resim ve konuşma girerek aynı formatta çıktılar alacak.