DeepSeek’ten daha az hesaplama gücü gerektiren yeni model: DeepSeek-V3.2- Exp

API fiyatlarında %50 indirime giden DeepSeek, yeni modeli “gelecek nesil mimariye giden yolda bir ara adım” olarak tanıttı.

Çin merkezli yapay zeka girişimi DeepSeek, "deneysel" nitelikteki DeepSeek-V3.2-Exp adını verdiği yeni modelini tanıttı. Model, önceki büyük dil modeli sürümlerine kıyasla daha düşük maliyetle eğitilebilecek şekilde tasarlandı ve uzun metin dizilerini işleme konusunda gelişmiş yetenekler vadediyor.

DeepSeek, Hugging Face’te yaptığı açıklamada söz konusu modeli “gelecek nesil mimariye giden yolda bir ara adım” olarak tanımladı. DeepSeek’in bu yeni mimarisinin, şirketin V3 ve R1 sürümleriyle teknoloji dünyasında yarattığı etkiyi hatırlatan bir dönüm noktası olması bekleniyor.

Yeni modelde öne çıkan özelliklerden biri, DeepSeek Sparse Attention adı verilen bir mekanizma. Bu yapı, işlem maliyetlerini önemli ölçüde azaltırken belirli performans ölçütlerinde iyileşme sağlıyor. Yeni modelin ardından X'te açıklama yapan girişim, API fiyatlarında da yüzde 50'den fazla indirime gitti.

Her ne kadar yeni mimarinin, yılın başında piyasaları sarsan R1 ve V3 kadar dramatik bir etki yaratması beklenmese de başarılı olması halinde hem Çin’deki rakipler Alibaba’nın Qwen’i hem de küresel ölçekte OpenAI gibi şirketler üzerinde ciddi baskı oluşturabileceği öngörülüyor.

İlginizi çekebilir

© 2023 swipeline.co, Tüm Haklar Saklıdır.