Amazon, doğal ve akıcı konuşma deneyimi sunan yeni nesil yapay zeka modeli Nova Sonic'i tanıttı. Yeni model, Alexa altyapısını ileriye taşımanın yanında OpenAI ve Google gibi rakiplerle de doğrudan rekabet edecek bir seviyede konumlanıyor.
Amazon'un kurumsal yapay zeka geliştirme platformu Bedrock üzerinden geliştiricilerin erişimine açılan Nova Sonic, iki yönlü konuşma, hızlı tepki süresi ve gelişmiş ses tanıma yetenekleri sunuyor. Şirketin açıklamasına göre model, rakiplerine kıyasla %80’e kadar daha düşük maliyetle çalışıyor.
Bu yönüyle pazardaki en ekonomik sesli yapay zeka çözümü olan Nova Sonic, Alexa'nın yıllar içinde geliştirdiği teknik mimari üzerine inşa edildi. Konuşmaları anlamasına ek olarak internette arama yapabiliyor, üçüncü parti uygulamalara bağlanabiliyor ve özel veri kaynaklarından bilgi çekebiliyor.
Öne çıkan bir diğer özellik ise modelin gerçek zamanlı konuşmalara uyum sağlama becerisi. Nova Sonic, karşısındaki kişinin konuşma ritmini ve duraksamalarını dikkate alarak ne zaman yanıt vermesi gerektiğini anlayabiliyor. Ayrıca her konuşmayı yazıya dökerek geliştiricilere ek kullanım senaryoları da sağlıyor.
Dil tanıma kabiliyetiyle de gözleri üzerine çeken model, İngilizce, Fransızca, İtalyanca, Almanca ve İspanyolca dillerinde yalnızca %4.2 oranında hata oranıyla yüksek bir başarı sergiledi. Gürültülü ortamlarda veya çoklu konuşma senaryolarında da rakiplerine göre daha yüksek doğruluk oranı sunuyor.
Ortalama 1.09 saniye tepki seviyesiyle OpenAI’ın gerçek zamanlı ses API’ından bile daha hızlı konumlanıyor. Yapay zekayı insan becerilerine yakınlaştırma amacının bir uzantısı olan Nova Sonic'e ek ilerleyen dönemde görsel, işitsel ve diğer duyusal verileri de anlayabilen bir model geliştirilecek.
Popüler İçerikler