Google, Gemini 2.0 Flash'ı yayınladı

Google, Gemini 2.0 Flash’ı yayınladı

Google Gemini 2.0 Flash, metnin yanı sıra ses ve video alanındaki etkinlikleriyle ve dil seçeneklerindeki gelişmelerle yayınlandı.

Google, şimdiye kadarki en yetenekli yapay zeka olarak öne sürdüğü Gemini 2.0 Flash’ı yayınladı. Artık Gemini, metinlere ek olarak görüntü ve ses de üretecek. Bunun yanı sıra üçüncü taraf uygulamalar üzerinden Google Arama kısmına erişim olacak.

Gemini 1.0, bilgiyi anlama ve organize etme alanlarında etkinken 2.0 Flash ile bilgiler çok daha kullanışlı hale geliyor. Geçtiğimiz gün Google, 2.0 Flash’ı, Gemini API ve Google’ın AI geliştirici platformları AI Studio ve Vertex AI’da erişime açtı. Ses ve görüntü için ise Ocak ayını beklemek gerekiyor.

2.0 Flash, çok yönlü yetenekleriyle öne çıkıyor

İlk nesilde metin üretimiyle öne çıkan Google, şu anda zorlu görevleri yerine getiriyor. Çok yönlü bu yeni model, üçüncü taraf işlemlerden arama yapıyor. Ayrıca harici API’larla etkileşime geçiyor.

Google, yeni modeli için testler üzerinde çalışıyor. Bu testlere göre 2.0 Flash, Gemini 1.5 Pro modeline göre iki kat daha hızlı kodlama ve görüntü analizi yapabiliyor.

2.0 Flash bunlarla sınırlı kalmayarak ses ve videolar üzerinden sorgulama yapmaya izin veriyor. Örneğin bir video yükleyip o konuda ne anlattığını özetlemesini istediğinizde size yanıtlar üretiyor.

Project Astra iyileştirmelerle gelişti

Android telefon içinde Project Astra; Google Arama, Lens, Haritalar ve daha birçok uygulamada entegrasyon sağlıyor. Bu yönüyle sanal asistan olarak çalışıyor. Project Astra, birden fazla dilde sohbet etmeye ve yaygın olmayan kelimeleri anlamaya başladı.

Hafıza konusundaki gelişmelerle 10 dakikaya kadar oturum içi hafızasıyla ön planda. Ayrıca geçmişteki bazı konuşmaları da hatırlayarak yanıtlar üretiyor. Bu kişisel kullanımı destekleyen bir nokta.

Project Mariner test ediliyor

Kullanıcının Chrome’daki gezinmelerine göre tarayıcı ekranındaki bilgileri anlayan ve mantık yürüten Project Mariner, ardından bunları bir Chrome uzantısına dönüştürüyor. Daha sonra ilgili görevleri tamamlıyor.

Bu görevler arasında satın alma gibi hassas noktalar varsa bunlar için kullanıcıdan onay alıyor. Şu anda test aşamasında olan uygulama, yakın zamanda duyurulabilir.

Multimodal Live API, kullanıma açıldı

Kullanıcıların gerçek zamanlı ses ve video akışı girişleriyle multimodal uygulamalar oluşturabileceği Multimodal Live API kullanıma açıldı.

API, farklı araçların entegrasyonunu destekleyerek OpenAI’ın Realtime API gibi çalışıyor.

Şu anda Gemini 2.0 Flash kullanıma açılmış olsa da birçok özellik önümüzdeki aylarda herkese açık olacak.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili İçerikler