ByteDance’ten aynı anda 4 veri türünü işleyen yeni video modeli: Seedance 2.0

Jimeng platformunda beta sürümünde erişime açılan Seedance 2.0; görsel, video, ses ve metni aynı anda işleyebiliyor.

ByteDance, yapay zeka destekli video üretiminde çıtayı yükselten yeni modeli Seedance 2.0’ı sınırlı sayıda kullanıcıyla beta olarak buluşturdu. Şirketin bir önceki sürümü halihazırda piyasadaki en yetkin üretken video araçlarından biri olarak görülüyordu. Yeni versiyon ise çoklu girdi kapasitesi ve gelişmiş referans yetenekleriyle bu iddiayı daha ileri taşıyor.

Seedance 2.0; görüntü, video, ses ve metin olmak üzere dört farklı veri türünü aynı anda işleyebiliyor. Model, kullanıcılar dokuz adede kadar görsel, üç video ve üç ses dosyasını tek bir projede birleştirmesine izin veriyor. Toplamda 12 dosyaya kadar destek sunan sistem, 4 ila 15 saniye uzunluğunda ve otomatik olarak ses efektleri ya da müzik içeren videolar üretiyor.

ByteDance’in paylaştığı tanıtım videoları teknik açıdan dikkat çekici bir kalite sergiliyor. Ancak bu içeriklerin büyük olasılıkla özenle seçilmiş örnekler olduğu belirtiliyor. Modelin gerçek kullanım senaryolarında aynı kaliteyi ne ölçüde ve ne kadar tutarlı şekilde sunacağı, üretim süreleri ve maliyet yapısı henüz bilinmiyor.

Şirketin öne çıkardığı en önemli yenilik, “referans alma” kabiliyeti. Seedance 2.0, yüklenen referans videolardaki kamera hareketlerini, çekim açılarını ve özel efektleri analiz ederek yeni sahnelere uygulayabiliyor. Mevcut klipleri uzatma, karakter değiştirme ya da sahneye yeni karakter ekleme gibi video düzenleme işlemleri de model tarafından gerçekleştirilebiliyor.

Kullanıcılar sistemi basit metin komutlarıyla yönlendiriyor. Örneğin, belirli bir görseli sahnenin başlangıç karesi olarak tanımlayıp, başka bir videodaki kamera hareketlerini uygulamak veya farklı referans karelerden kompozisyon oluşturmak mümkün.

Uyum ve güvenlik gerekçeleriyle, yüklenen materyallerde gerçekçi insan yüzlerinin kullanımı şu aşamada engellenmiş durumda. Seedance 2.0, ByteDance’in resmi Jimeng platformu üzerinden sınırlı sayıda kullanıcılara beta sürümü kapsamında sağlanıyor.

Gelişme, rakip Kuaishou’nun çok modlu girdi ve çıktı desteği sunan Kling 3.0 modelini duyurmasından yalnızca birkaç gün sonra geldi. Çin’de yapay zekâ destekli video üretimi alanındaki rekabet hız kazanırken, finansal piyasalarda da etkileri hissediliyor. South China Morning Post’un aktardığına göre, yeni nesil video modellerinin lansmanı Çinli medya ve yapay zekâ şirketlerinin hisselerinde yüzde 20’ye varan artışlara yol açtı.

Teknoloji devlerinin agresif lansman takvimi, üretken video alanında küresel rekabetin yeni bir aşamaya geçtiğine işaret ediyor. Ancak sektörün önündeki asıl sınav, bu etkileyici demoların ölçeklenebilir ve sürdürülebilir ticari ürünlere dönüşüp dönüşemeyeceği olacak.

İlginizi çekebilir

© 2023 swipeline.co, Tüm Haklar Saklıdır.