DeepSeek, 671 milyar parametreye sahip modeliyle OpenAI’a meydan okuyor

DeepSeek’in 671 milyar parametreye sahip R1 modeli, OpenAI’nın o1 modeline %90 ila %95 oranında daha ucuz bir alternatif oluşturuyor.

Çin merkezli yapay zeka girişimi DeepSeek, DeepSeek-R1 adını verdiği akıl yürütme yeteneğine sahip yeni modelinin belirli ölçütlerde OpenAI’ın o1’inden daha iyi performans gösterdiğini iddia ediyor. 

Hugging Face üzerinden MIT lisansı ile herhangi bir kısıtlama olmadan ticari kullanıma açık olan R1; matematik problemlerini çözme yetenekleri ve programlama görevlerini yerine performansıyla yapay zeka devi OpenAI’ın piyasaya sürdüğü en gelişmiş modeli o1’i geride bırakıyor. 

Rapora göre R1, aynı zamanda o1’den %90 ila %95 arasında daha ucuz fiyat avantajı sunuyor ve 671 milyar parametre içeriyor. o1'in parametre sayısı ise bilinmiyor. Bu neden önemli? Parametreler kısaca bir yapay zeka modelinin problem çözme kapasitesini ve öğrenme yeteneğini ifade ediyor.

Parametre sayısı arttıkça modelin çalıştırılması için gereken hesaplama gücü ve bellek ihtiyacı da eş zamanlı olarak artıyor. Küçük veri setleri üzerinde basit modeller daha iyi performans gösterirken, büyük ve karmaşık veri setleri için daha fazla parametre gerekir. 

DeepSeek, R1’e ek olarak 1.5 milyar parametreden 70 milyar parametreye kadar değişen boyutlarda sürümler yayınladı.

İlginizi çekebilir

© 2023 swipeline.co, Tüm Haklar Saklıdır.