4 Kat Daha Dürüst Yapay Zekâ: Claude Opus 4.8 Duyuruldu

Anthropic, Claude ailesinin yeni güçlü modeli Claude Opus 4.8’i resmen kullanıma sundu. Şirketin açıklamasına nazaran yeni model, Opus 4.7’nin üzerine inşa edildi ve bilhassa yazılım geliştirme, casus tabanlı vazifeler, bilgi işleri ve çok adımlı akıl yürütme bahislerinde daha güzel sonuçlar veriyor. Üstelik standart kullanım fiyatı da değişmedi.

İçerikten Görseller

+ −

‹ ›

Ancak Claude Opus 4.8’i asıl dikkat alımlı yapan şey sadece daha güçlü olması değil. Anthropic, yeni modelin bilinmeyen olduğu durumları daha açık formda söz ettiğini, kâfi delil yokken “eminmiş gibi” konuşma ihtimalinin azaldığını söylüyor. Şirketin değerlendirmelerine nazaran model, yazdığı koddaki kusurları fark etmeden geçme konusunda selefine kıyasla yaklaşık 4 kat daha düşük risk taşıyor.

İçerikten Görseller

+ −

‹ ›

Claude Opus 4.8, Daha Az “Uyduran” Bir Yapay Zekâ Olmayı Hedefliyor

Yapay zekâ modellerinde en çok eleştirilen bahislerden biri, yanlış bilgiyi kendinden emin biçimde sunmaları. Anthropic’in Opus 4.8 ile çözmeye çalıştığı sorun da tam olarak bu. Model, yaptığı işte emin değilse bunu kullanıcıya daha net söylüyor ve eksik delille kesin sonuçlara varma eğilimini azaltıyor.

Anthropic’in güvenlik testlerine nazaran Opus 4.8, aldatıcı davranış, kötüye kullanımla iş birliği ve kullanıcıyı yanlış yönlendirme üzere bahislerde Opus 4.7’ye nazaran daha düşük skorlar aldı. Hatta şirket, bu modelin uyumlu davranış tarafında en âlâ modellerinden biri olan Claude Mythos Preview’a yakın sonuçlar verdiğini belirtiyor.

Kodlama ve Casus Vazifelerinde de Performans Artışı Var

Paylaşılan benchmark sonuçlarına nazaran Claude Opus 4.8, SWE-Bench Pro kodlama testinde %69,2 muvaffakiyet oranına ulaştı. Ayrıyeten çok disiplinli akıl yürütme, bilgisayar kullanımı, finansal tahlil ve bilgi işleri üzere alanlarda da Opus 4.7’ye kıyasla daha yeterli sonuçlar elde etti.

Yeni modelle birlikte Claude Code tarafına Dynamic Workflows isimli yeni bir özellik de eklendi. Bu özellik sayesinde Claude, büyük ölçekli yazılım projelerinde işi planlayabiliyor, yüzlerce alt casusu tıpkı oturumda çalıştırabiliyor ve çıktıları denetim ederek kullanıcıya sunabiliyor. Anthropic’e nazaran bu sistem, yüz binlerce satırlık kod tabanlarında büyük dönüşüm süreçlerini mümkün hâle getiriyor.

Claude’un Ne Kadar “Düşüneceğini” Artık Kullanıcı Seçebilecek

Claude Opus 4.8 ile gelen bir öteki değerli yenilik ise Effort Control oldu. Bu özellik, Claude’un bir vazifeye ne kadar uğraş harcayacağını seçmenizi sağlıyor. Daha yüksek ayarlarda model daha fazla düşünerek daha kaliteli cevaplar üretirken, düşük ayarlarda daha süratli ve daha az kaynak tüketen karşılıklar verebiliyor.

Anthropic ayrıyeten Opus 4.8’in süratli çalışma modunun evvelki modellere nazaran daha ucuz hâle geldiğini açıkladı. Şirket, Opus düzeyindeki yetenekleri daha düşük maliyetle sunacak yeni modeller üzerinde çalıştığını da belirtiyor. Bunun yanında daha gelişmiş bir model sınıfı olarak tanımlanan Claude Mythos Preview da önümüzdeki haftalarda daha geniş kullanıcı kitlesine açılabilir.

Webtekno

https://www.webtekno.com/claude-opus-4-8-duyuruldu-h217675.html

Blog

30.05.2026

122

Model Kullanıcı İş Claude Modelle Sonuçlar Anthropic Opus

Ziyaretçi Yorumları

Henüz yorum yapılmamış. İlk yorumu aşağıdaki form aracılığıyla siz yapabilirsiniz.

[ Yoruma cevap yazmaktan vazgeç ]