OpenAI, yeni görsel yapay zeka modeli ChatGPT Images 2.0'ı duyurdu

OpenAI, yapay zeka destekli görsel üretim teknolojisinde önemli bir adım atarak ChatGPT Images 2.0 modelini duyurdu. Şirketin açıklamasına göre model; talimatları daha doğru takip etme, detayları koruma ve metin üretimi konularında kayda değer iyileştirmeler sunuyor.

Yeni model, yalnızca görsel üretmekle kalmıyor aynı zamanda düşünme yetenekleriyle de dikkat çekiyor. OpenAI’ın paylaştığı bilgilere göre sistem, görüntü oluşturmadan önce sahnenin yapısını mantıksal olarak analiz edebiliyor. Ayrıca gerektiğinde internetten bilgi çekerek veya kullanıcı tarafından yüklenen dosyaları inceleyerek daha doğru ve bağlamsal görseller üretiyor.

ChatGPT Images 2.0’ın ürün deneyimi üç temle unsur etrafında şekilleniyor: tipografi, dilsel çeşitlilik ve sıralı tutarlılık. Bu özellikler sayesinde model, özellikle metin içerek görsellerde ve birden fazla sahneden oluşan içeriklerde daha başarılı sonuçlar sunuyor.

Modelin en dikkat çekici yeniliklerinden biri, tek bir komutla sekiz adede kadar görsel oluşturabilmesi. Üstelik bu görsellerde karakterler, nesneler ve stil tutarlı şekilde korunabiliyor. Bu özellik; manga sayfaları, storyboard’lar, marka kampanyaları ve hatta ev tasarım planları gibi çok aşamalı projelerde çalışan içerik üreticileri için önemli avantajlar sağlıyor.

Görsel üretim tarafında teknik kapasite de genişletilmiş durumda. Kullanıcılar artık 2K çözünürlüğe kadar görseller oluşturabilirken 3:1 gibi geniş veya 1:3 gibi dikey formatlarda farklın en-boy oranlarını tercih edebiliyor.

Dil desteği de önemli ölçüde artırılmış durumda. Model, yalnızca İngilizce ve Latin alfabesiyle sınırlı kalmayıp Japonca, Korece, Çince, Hintçe ve Bengalce gibi dillerde metin içeren görseller üretmede de gelişim gösteriyor.

Öte yandan OpenAI, mevcut ürün ailesinde bir değişikliğe giderek GPT-Image-1.5 modelini varsayılan kullanımdan kaldıracağını açıkladı. Eski modelin yalnızca API üzerinden erişilebilir olmaya devam edeceği belirtiliyor.

Yeni nesil GPT Image 2’nin sunduğu gelişmiş düşünme özellikleri ise Plus, Pro, Business ve Enterprise abonelerine sunulmuş durumda. Ücretsiz kullanıcılar ise daha temel görevler için ImageGen 2.0 modeline erişebiliyor.

OpenAI ayrıca geliştiriciler için gpt-image-2-API’ı da kullanıma sunmaya hazırlanıyor. Bu adım, görsel üretim teknolojilerinin farklı platform ve uygulamalara entegrasyonunu hızlandıracak önemli bir gelişme olarak değerlendiriliyor.