DeepSeek’ten daha az hesaplama gücü gerektiren yeni model: DeepSeek-V3.2- Exp

Çin merkezli yapay zeka girişimi DeepSeek, "deneysel" nitelikteki DeepSeek-V3.2-Exp adını verdiği yeni modelini tanıttı. Model, önceki büyük dil modeli sürümlerine kıyasla daha düşük maliyetle eğitilebilecek şekilde tasarlandı ve uzun metin dizilerini işleme konusunda gelişmiş yetenekler vadediyor.

DeepSeek, Hugging Face’te yaptığı açıklamada söz konusu modeli “gelecek nesil mimariye giden yolda bir ara adım” olarak tanımladı. DeepSeek’in bu yeni mimarisinin, şirketin V3 ve R1 sürümleriyle teknoloji dünyasında yarattığı etkiyi hatırlatan bir dönüm noktası olması bekleniyor.

Yeni modelde öne çıkan özelliklerden biri, DeepSeek Sparse Attention adı verilen bir mekanizma. Bu yapı, işlem maliyetlerini önemli ölçüde azaltırken belirli performans ölçütlerinde iyileşme sağlıyor. Yeni modelin ardından X'te açıklama yapan girişim, API fiyatlarında da yüzde 50'den fazla indirime gitti.

Her ne kadar yeni mimarinin, yılın başında piyasaları sarsan R1 ve V3 kadar dramatik bir etki yaratması beklenmese de başarılı olması halinde hem Çin’deki rakipler Alibaba’nın Qwen’i hem de küresel ölçekte OpenAI gibi şirketler üzerinde ciddi baskı oluşturabileceği öngörülüyor.

DeepSeek’ten daha az hesaplama gücü gerektiren yeni model: DeepSeek-V3.2- Exp

İlginizi çekebilir

Anthropic CEO'su Dario Amodei: Nvidia’nın Çin’e çip satması ABD’ye pahalıya patlayacak

Intel, Intel Foundry'i bağımsız bir yan marka haline getiriyor

Popüler İçerikler