Apple, üretken yapay zeka teknolojisi kullanarak geliştirdiği MGIE isimli açık kaynaklı modeliyle kullanıcıların metin komutlarıyla istedikleri görselleri düzenlemelerine olanak tanıyor.
Kılavuzlu Görüntü Düzenleme (Guided Image Editing) anlamına gelen MGIE, çok modlu büyük dil modellerinden (MLLM) güç alarak kullanıcılar tarafından verilen komutları yorumluyor ve görsellerde piksel düzeyinde düzenlemeler yapılmasına yardımcı oluyor.
Apple'ın Kaliforniya Üniversitesi ile yaptıkları iş birliğinin meyvesi olarak ortaya çıkan model, kullanıcıların sosyal medya, e-ticaret, eğitim ve sanat gibi kişisel veya profesyonel amaçlar için daha kaliteli görseller oluşturmasını ve optimize etmesini kolaylaştırıyor.
MGIE nasıl çalışır?
Hem metin hem de görüntüleri işleyebilen MGIE, çok modlu büyük dil modellerini kullanarak kullanıcı girişlerinden anlamlı talimatlar üretiyor. Düzenleme süreci için "gökyüzünü daha mavi yap", "bilgisayara yeşil internet sitesi ekle" ve "arkadaki kadını görselden kaldır" gibi kısa ve net cümleleri işleyen MGIE, aynı zamanda yapay zeka gücüyle yeni imgeler eklemeyi de olanaklı kılıyor.
Basit renk ayarlamalarından karmaşık nesne manipülasyonlarına kadar çeşitli görsel düzenleme opsiyonları sunan MGIE, GitHub'da açık kaynaklı bir proje olarak yayına alındı. Kullanıcıların yeni modeli nasıl kullanacağına dair yönergelerin bulunduğu bir kılavuz paylaştı. Kullanımı kolay ve özelleştirmesi esnek olarak tasarlanan MGIE, kullanıcılardan fotoğraf düzenleme yeteneklerini geliştirmek için geri bildirim alıyor.
Popüler İçerikler