Runway, yapay zeka ajanlarının ve robotların eğitimine odaklanan ilk dünya modelini tanıttı

Yapay zeka destekli görüntü ve video üretim platformu Runway, kare kare tahmin yöntemiyle çalışan, zaman içinde dünyanın nasıl davrandığını ve fizik kurallarını anlayarak simülasyon oluşturan ilk dünya modeli GWM-1'ı tanıttı.

Dünya modeli, yapay zeka sistemlerinin akıl yürütmesini, plan yapmasını ve eyleme geçmeden önce olası senaryoları zihninde test etmesini sağlıyor. Odağını görsel üretimin ötesine taşıyan Runway, GWM-1 ile sahneleri tek tek görüntüler üretmek yerine zaman içinde nasıl değişmeleri gerektiğine kadar tahmin ediyor.

Yeni model, yapay zeka ajanları ve robotların gerçek dünyaya çıkmadan önce sanal ortamlarda eğitilmesini sağlıyor. GWM-1, farklı çevresel koşulları, engelleri ve senaryoları simüle ederek sistemlerin nasıl karar vereceğini, hareket edebileceği ve hangi durumlarda hata yapabileceğini test ediyor.

Runway CTO’su Anastasis Germanidis, “Bir dünya modeli inşa edebilmek için önce gerçekten güçlü bir video modeli geliştirmemiz gerekiyordu. Bizce dünya modeli geliştirmenin doğru yolu, modelleri pikselleri doğrudan tahmin etmeyi öğreterek genel amaçlı simülasyona ulaşmak. Yeterli ölçek ve doğru verilerle, dünyanın nasıl çalıştığını anlayabilen bir model oluşturmak mümkün,” dedi.

Runway, yeni 'dünya modeli' için üç farklı sürüm duyurdu: GWM-Worlds, GWM-Robotics ve GWM-Avatars.

GWM-Worlds, kullanıcıların etkileşimli projeler oluşturmasına olanak tanıyan bir uygulama. Kullanıcılar bir sahneyi metin komutuyla ya da görsel referansla belirleyebiliyor; ortamda gezindikçe model, geometri, fizik ve ışık bilgisine dayanarak dünyayı gerçek zamanlı üretiyor.

Simülasyonun 24 fps ve 720p çözünürlükte çalıştığı belirten yapay zeka girişimi, modelin oyun geliştirme için kullanılabileceği gibi, yapay zeka ajanlarına fiziksel dünyada nasıl hareket edeceklerini öğretmek için de uygun olduğunu belirtti.

GWM-Robotics tarafında girişim, değişen hava koşulları veya engeller gibi yeni parametrelerle zenginleştirilmiş sentetik veriler kullanmayı hedefliyor. Runway, bu yaklaşımın robotların hangi senaryolarda ve nasıl politika ya da talimat ihlali yapabileceğini de ortaya koyabileceğini söylüyor.

GWM-Avatars, insan davranışlarını simüle edebilen gerçekçi avatarlar geliştirmeye odaklanıyor. Daha önce D-ID, Synthesia, Soul Machines ve Google gibi şirketler de iletişim ve eğitim gibi alanlarda kullanılan gerçekçi insan avatarları üzerinde çalışmıştı.

Teknik olarak ayrı modeller olan Worlds, Robotics ve Avatars’ın, uzun vadede tek bir modelde birleştirilmesi planlanıyor.

Öte yandan Runway, ay başında duyurduğu Gen 4.5 temel modelini de güncelledi. Yeni güncelleme; yerleşik (native) ses, uzun formatlı ve çok sahneli video üretimi gibi özellikler getiriyor. Kullanıcılar; karakter tutarlılığı olan, doğal diyaloglar, arka plan sesleri ve farklı açılardan çekilmiş karmaşık sahneler içeren bir dakikalık videolar üretebilecek.

Bu güncelleme, Runway’i bu ay piyasaya çıkan rakip Kling’in “hepsi bir arada” video paketine biraz daha yaklaştırırken, video üretim modellerinin prototip aşamasından üretime hazır araçlara doğru ilerlediğini de gösteriyor. Güncellenen Gen 4.5 modeli, tüm ücretli plan kullanıcılarına sunulmuş durumda.

Runway ayrıca GWM-Robotics’i bir SDK üzerinden erişime açacağını ve halihazırda birçok robotik firması ve şirketle GWM-Robotics ile GWM-Avatars’ın kullanımı konusunda aktif görüşmeler yürüttüğünü açıkladı.

Runway, yapay zeka ajanlarının ve robotların eğitimine odaklanan ilk dünya modelini tanıttı

İlginizi çekebilir

YouTube’un Premium abonelere özel oyun oynama özelliği: Playables

ABD, İngiltere ve AB, yapay zeka standartları konusunda anlaşma imzalayacak

Popüler İçerikler