Yapay zeka sektörünün önde gelen şirketlerinden Anthropic, bugün en güçlü dil modeli Claude Opus 4.6'yı betada kullanıma sunduğunu duyurdu. Yeni model, selefine kıyasla kodlama becerilerini önemli ölçüde geliştirdi; daha dikkatli planlama yapabiliyor, ajansal görevleri daha uzun süre sürdürebiliyor ve büyük kod tabanlarında daha güvenilir çalışabiliyor.
Claude Opus 4.6, Anthropic Opus ailesinde bir ilk olarak, beta aşamasında 1 milyon token bağlam penceresi sunuyor. Bu özellik, modelin büyük veri setlerinden bilgi çıkarma ve uzun kapsamlı kodlama görevlerinde çok daha etkili olmasını sağlıyor.
Model, çeşitli değerlendirmelerde sektör lideri performans sergiliyor. Ajansal kodlama değerlendirmesi Terminal-Bench 2.0'da en yüksek puanı elde ederken, karmaşık çok disiplinli akıl yürütme testi Humanity's Last Exam'da diğer tüm öncü modelleri geride bırakıyor.
Modelin ARC AGI 2 benchmark'ında elde ettiği yüzde 68,8'lik skor da dikkat çekiyor. Claude Opus 4.5 bu testte yalnızca yüzde 37,6 alırken, Google'ın Gemini 3 Pro modeli yüzde 45,1, OpenAI'ın GPT-5.2'si ise yüzde 54,2 skorunda kalmıştı.
Anthropic'in modelleri özellikle kurumsal müşteriler arasında popüler ve bu segment şirketin işinin yaklaşık %80'ini oluşturuyor. Opus 4.6'nın becerilerinin de buna göre şekillendiğini söyleyebiliriz. Model; finansal analizler yürütme, araştırma yapma ve belgeler, tablolar ile sunumlar oluşturma gibi günlük iş görevlerinde gelişmiş yetenekler sunuyor.





Popüler İçerikler