Tencent, çeviri odaklı model serisi Hunyuan-MT’yi açık kaynak kodlu yayınladı

Hunyuan-MT, WMT25 adlı çeviri kıyaslamasında Google Translate’ten büyük oranda daha iyi performans gösterdi.

Çinli teknoloji devi Tencent, makine çevirisi alanında Google, OpenAI ve Anthropic’e meydan okuyacak yeni açık kaynaklı yapay zeka model serisi Hunyuan-MT’yi tanıttı.

Seri, amiral gemisi Hunyuan-MT-7B ve Hunyuan-MT-Chimera-7B olmak üzere 7 milyar parametreye sahip iki büyük modelden oluşuyor. Ayrıca daha düşük bellek kullanımına ihtiyaç duyan geliştiriciler için doğruluk oranından kısmen ödün veren iki sıkıştırılmış sürüm de yayımlandı.

Tencent, modelleri 33 dili kapsayan metinler ve milyonlarca çeviri çifti içeren dört veri setiyle eğitti. Şirket, Hunyuan-MT’nin yalnızca çeviri becerisi kazanmadığını, aynı zamanda genel bilgi testlerinde de öne çıktığını vurguluyor. Model, MMLU-Pro kıyaslamasında 8 milyar parametreli Llama-3-8B-Base’i geride bıraktı.

Ek olarak, modeller pekiştirmeli öğrenme süreciyle geliştirildi. Tencent’in özel olarak tasarladığı bir yapay zeka, yapılan çevirilerin anlamsal doğruluğunu ve alanlara özgü terminoloji kullanımını değerlendirerek modellerin kaliteyi artırmasını sağladı.

Tencent’in Hunyuan-MT serisi, küresel çeviri teknolojileri pazarında yeni ve iddialı bir rakip olarak konumlanıyor. Açık kaynaklı olması, hem araştırmacılar hem de girişimciler için modeli cazip hale getirirken, Google ve OpenAI’nin hakimiyetine yönelik güçlü bir meydan okuma niteliği taşıyor.

İlginizi çekebilir

© 2023 swipeline.co, Tüm Haklar Saklıdır.