OpenAI, çok beklenen sesli yanıt özelliğini kullanıma sundu

OpenAI, geçtiğimiz gün ChatGPT-4o kullanıcılarının bir kısmına hiper gerçekçi ses yanıtlarını sunmaya başladı. Bu yüksek çözünürlüklü ses için alfa sürümünü ise bugün deneyecek. ChatGPT Plus kullanıcılarından bir grup belirleyerek özelliği kademeli olarak test ediyor. Ayrıca 2024 sonbaharında tüm kullanıcılar için erişilebilir olacak.

Geçtiğimiz Mayıs ayında aslında şirket bu alanda denemeler yapmıştı. Hatta bir sesin “Her” filmindeki Scarlett Johansson’un sesine son derece benzerlik göstermişti. Bu doğrultuda Johansson yasal yollara başvurmuştu. Ancak şirket bu durumu reddetmesine rağmen yine de bu sesi kaldırmasıyla şüpheleri üzerine çekmişti. Şimdi ise farklı denemelerle öne çıkıyor.

GPT-4o demosu, hala sadece bir demo

Şirket yeni özellikleri herkese açık hale getirmeden önce denemeler yapmaya devam ediyor. Yalnızca bazı premium kullanıcıları ses gibi yeni özelliklere erişiyor. OpenAI Gelişmiş Ses Modu ise diğerlerinden oldukça farklı olmasıyla ön planda. Şirket, sadece metni sese dönüştürmek gibi bir yol izlemiyor.

GPT-4o, sesteki duygusal vurgulamaları da fark ediyor. Üzüntü, heyecan ya da şarkı söyleme gibi tonlara uygun cevaplar üretiyor. Alfa kullanıcıları bu özelliğe erişmek için şirketten uyarı ve e-posta alacaklar. Ardından kullanmaya başlayabilecekler.

OpenAI, 100 kişiyle 45 farklı dilde testler yürütüyor

Şirketin yaptığı açıklamaya göre ses yeteneklerini geliştirmek için 45 farklı dil için 100 kişiden fazla ekip üyesiyle testler gerçekleşiyor. Bu durumla ilgili Ağustos ayında bir rapor yayınlayacaklarını söylüyor. Şirket, Gelişmiş Ses Modu için ücretli seslendirme sanatçılarıyla çalışıyor. Özellikle Sky sesinden sonra OpenAI Sözcüsü Lindsay McCallum şunları söyledi:

ChatGPT, hem bireyler hem de tanınmış kişiler olmak üzere başkalarının seslerini taklit edemez ve bu önceden ayarlanmış seslerden birinden farklı olan çıktıları engelleyecektir.
OpenAI Sözcüsü Lindsay McCallum

Şirket, telif haklarıyla korunan sesler ve bazı müzikler için filtreler geliştiriyor. Bu sayede şikayetleri azaltmayı ve tamamen yasal çıktılar üretmeyi hedefliyor. Bu durum olası telif hakkı ihlallerinin önüne geçebilir.