OpenAI, dil modellerinin yalnızca metin değil aynı zamanda görsel oluşturma konusunda da yetkin olması gerektiği inancıyla GPT-4o modelinin yeteneklerini geliştirerek şimdiye kadarki en güçlü görüntü oluşturma yeteneklerini entegre etti.
Yeni özellikler ilk olarak ChatGPT Pro, Plus ve Team aboneliklerini satın alan kullanıcılara açılacak. Beklentilerin üzerinde bir kullanıcı talebi olduğu için GPT-4o'nun gelişmiş yetenekleri önümüzdeki günlerde ChatGPT'nin ücretsiz kullanıcı tabanına sunulacak.
GPT-4o’nun görüntü oluşturma yetenekleri, metinleri doğru bir şekilde görsellere entegre etme, yüklenen görüntülerden ilham alma ve karmaşık talepleri yerine getirme konusunda büyük bir gelişim gösteriyor. Bu sayede yeni model, yaratıcı süreçleri destekleyen ve görsel iletişimi güçlendiren bir araç olarak konumlanıyor.
Görüntü ve metin arasındaki ilişkiyi daha derinlemesine anlayacak şekilde eğitilen GPT-4o, çevrimiçi görsellerin ve metinlerin ortak dağılımını analiz ederek yalnızca dil modelinin görselleri nasıl yorumlaması gerektiğini değil, aynı zamanda görseller arasındaki ilişkileri de öğrendi.
Bir önceki model olan GPT-4o Turbo'ya kıyasla GPT-4o; kullanıcıların daha akıcı, tutarlı ve bağlama duyarlı görseller üretebilmesine olanak tanıyor. Talimatları daha hassas bir şekilde takip ederek 10 ila 20 nesneye kadar karmaşık sahneleri doğru şekilde oluşturan yeni model, daha etkili bir görsel iletişim yolu sunuyor.
Popüler İçerikler