Google, Gemini’a video oluşturma aracı Veo’yu entegre etmeyi planlıyor

Google DeepMind CEO’su Demis Hassabis, Linkedln kurucu ortağı Reid Hoffman’ın sunduğu Possible isimli podcast programında şirketin yapay zeka alanındaki gelecek vizyonunu paylaştı.

Hassabis, Google’ın Gemini modellerini yapay zeka video oluşturma aracı Veo ile birleştirme hedeflerini açıkladı. Hassabis, “Temel modelimiz olan Gemini’ı başından beri çoklu modlu (multimodal) yapmayı planladık. Bunun nedeni, evrensel bir dijital asistan fikrini hayata geçirmeyi arzu etmemiz” dedi.

Yapay zeka sektörünün giderek daha fazla omni modellere yöneldiğine dikkat çeken Hassabis, bu modellerin farklı medya türlerini anlayabilen ve sentezleyebilen yapılar olarak tanımlanabileceğini belirtti.

Google’ın en yeni Gemini modelleri, metin ve görsellerin yanı sıra sesli içerik de üretebiliyor. Öte yandan, OpenAI’nin ChatGPT’si de son güncellemelerle birlikte, görseller oluşturma yeteneğine sahip oldu. Amazon da bu yıl içinde "her şeyden her şeye" dönüştürme kapasitesine sahip bir model tanıtmayı planladığını duyurdu.

Bu tür modeller, farklı medya türlerinden gelen devasa veri yığınları ile besleniyor. Görseller, videolar, sesler, metinler gibi çok çeşitli veri türlerinin bir araya getirilmesi gerekiyor. Hassabis, bu bağlamda Google’ın video verilerini özellikle YouTube üzerinden topladığını ekledi.

Hassabis, “Temelde Veo 2, YouTube videolarını izleyerek çok sayıda YouTube videosunu izleyerek dünyanın fiziğini anlayabiliyor” diyerek videp verilerinin nasıl kullanıldığı konusunda ipucu paylaştı.

Google, Gemini’a video oluşturma aracı Veo’yu entegre etmeyi planlıyor

İlginizi çekebilir

Popüler İçerikler