Anthropic, yeni yapay zeka modeli Claude Opus 4.7'yi tanıttı

Anthropic, yapay zeka alanındaki rekabeti bir adım ileri taşıyan yeni modeli Claude Opus 4.7’yi duyurdu. Şirketin açıklamalarına göre model; yazılım mühendisliği, talimatları takip etme ve gerçek dünya görevleri gibi alanlarda önceki sürüm Opus 4.6’ya kıyasla önemli iyileştirmeler sunuyor.

Yeni modelin öne çıkan yönleri arasında agentic kodlama, çok disiplinli akıl yürütme, ölçeklendirilmiş araç kullanımı ve agentic bilgisayar kullanımı bulunuyor. Anthropic, bu alanlarda yapılan endüstri benchmark testlerinde Opus 4.7’nin selefinden daha yüksek performans sergilediğini vurguluyor.

Özellikle yazılım geliştirme performansını ölçen SWE-Bench Pro testinde modelin aldığı %64.3 puan, bir önceki versiyona göre yaklaşık %10’luk bir artışa işaret ediyor. Bunun yanı sıra, komut satırı tabanlı kodlama görevlerini içeren Terminal-Bench 2.0 veri setinde de daha fazla görevi başarıyla tamamladığı belirtiliyor.

Her ne kadar Anthropic, Opus 4.7’yi “en güçlü model” olarak tanımlasa da modelin siber yetenekleri şirketin daha sınırlı bir gruba sunduğu Mythos kadar ileri seviyede değil. Mythos’un geniş çapta yayınlanmamasının nedeni ise kötüye kullanım ve siber saldırı riski olarak açıklanmıştı.

Bu noktada Opus 4.7, önemli bir farkla öne çıkıyor. Model, siber saldırı amaçlı kullanım girişimlerini tespit edebilen bir mekanizmaya sahip. Anthropic, bu sistem üzerinden elde edilecek verilerin gelecekte daha gelişmiş modeller için güvenlik katmanları oluşturmakta kullanılacağını ifade ediyor. Ayrıca Şirket, Siber Doğrulama Programı kapsamında güvenlik uzmanlarına daha geniş yetkiler tanımayı planlıyor.

Performans tarafında ise Opus 4.7, bazı görevlerde Mythos seviyesine yaklaşmayı başarıyor. Örneğin, lisansüstü düzey bilim sorularını içeren GPQA Diamond testinde en iyi modele oldukça yakın bir skor elde ettiği belirtiliyor.

API tarafında yeni özellikler

Anthropic, yeni modelle birlikte geliştiricilere yönelik çeşitli yenilikler de sundu. Bunlardan biri, API’daki “effort level” parametresine eklenen “xhigh” seçeneği. Bu özellik ile geliştiriciler, kalite ve maliyet dengesini daha hassas şekilde ayarlayabiliyor.

Ayrıca devreye alınan “task bugdets” özelliği, bir görevin harcayabileceği maksimum token sayısını önceden belirleme imkanı sunuyor. Bu da özellikle büyük ölçekli işlemlerde kontrol ve verimlilik sağlıyor.

Öte yandan Claude Code tarafında da yenilikler dikkat çekiyor. Yeni eklenen “ultrareview” komutu, kod dosyalarını hata ve potansiyel sorunlara karşı tararken “auto mode” özelliği ise uzun süren programlama süreçlerini otomatikleştirerek iş yükünü azaltıyor.

Claude Opus 4.7, Anthropic’n tüm Claude ürünleri üzerinden kullanılabiliyorken API üzerinden ise Microsoft, Google ve Amazon gibi büyük bulut sağlayıcıları aracılığıyla erişilebiliyor. Şirket, yeni modelin fiyatlandırmasının ise önceki sürümle aynı seviyede kaldığını belirtiyor.