Google, yeni ses modeli Gemini 3.1 Flash TTS'i duyurdu

Google, yeni ses modeli Gemini 3.1 Flash TTS’i duyurdu

Google, DeepMind ekibi tarafından geliştirilen metinden sese yapay zeka modeli Gemini 3.1 Flash TTS’i kullanıma sundu.

Google’ın yapay zeka araştırma birimi DeepMind, metinden sese dönüştürme alanında dikkat çeken yeni modeli Gemini 3.1 Flash TTS’i duyurdu. Yeni model, yalnızca metni sese çevirmekle kalmayıp aksan, tonlama ve konuşma hızı üzerinde gelişmiş kontrol imkanı sunuyor.

Şirketin açıklamasına göre Gemini 3.1 Flash TTS, önceki nesil daha “robotik” ses üretimlerinin önüne geçiyor. Kullanıcılar artık metin tabanlı komutlarla yapay zekanın vereceği yanıtların nasıl duyulacağını doğrudan belirleyebiliyor. Bu kapsamda sesin stili, sunumu ve temposu detaylı biçimde yönlendirilebiliyor.

Modelin öne çıkan özelliklerinden biri de duygusal tonlama seçenekleri. Kullanıcılar; “hevesli“, “sürpriz“, “bilgilendirici” gibi farklı tonlar arasında seçim yaparak sesin karakterini değiştirebiliyor. Ayrıca sistem, farklı dillerin bölgesel aksanlarını destekleyerek daha yerel ve gerçekçi bir konuşma deneyimi sunuyor.

Ton haricinde konuşma hızını ve tarzını da ayarlamak mümkün. Bununla birlikte farklı kullanım senaryolarına uygun hazır şablonlar üzerinden seçim yapılabiliyor.

Bu şablonlar arasında podcast, sesli kitap anlatımı, dil öğretmeni, asistan, sağlık rehberi, haber spikeri ve müşteri temsilcisi gibi farklı formatlar yer alıyor. Kullanıcılar, hayallerindeki sahneyi tanımlayıp diyalog akışlarını belirleyerek istedikleri atmosferi oluşturabiliyor. Ayrıca bu ayarların API kodu olarak dışa aktarılabilmesi, geliştiricilere önemli bir avantaj sağlıyor.

Model, 70’ten fazla dili destekleyerek küresel ölçekte geniş bir kullanım alanına hitap ediyor. Japonca, Hintçe ve Almanca gibi dillerde daha doğal ve akıcı ses retimi sağlandığı da belirtiliyor. Güvenlik tarafında ise tüm içeriklerin SynthID filigranı ile işaretlenmesi, yapay olarak üretildiğinin kolayca tespit edilebildiğini ifade ediliyor.

Performans tarafında da iddialı olan Gemini 3.1 Flash TTS, Artificial Intelligence TTS tablosunda 1.211 puanla ikinci sırada yer alıyor. Modeli deneyimlemek içinse Gemini API, Google AI Studio, Vertex ve Google Vids kullanılabiliyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili İçerikler