OpenAI, kod yazmak için ChatGPT'yi kullanan kullanıcıların kod çıktısındaki hataları görebilmelerine yardımcı olan GPT-4 tarafından desteklenen CriticGPT isimli yeni bir yapay zeka modeli geliştirdi.
Geliştiricilerin ChatGPT'den istedikleri kodları bir analiz sürecinden geçiren CriticGPT, yapay zeka modeli tarafından üretilen kodu inceleyerek bulunması zor olan hataları işaretliyor. Koddaki yanlışlıkların neler olduğunu kullanıcılara açıklayan CriticGPT, geliştiricilerin performansını %60'a kadar artırıyor.
GPT-4 serisi modeller, "İnsan Geri Bildirimi ile Pekiştirmeli Öğrenme" (RLHF) aracılığıyla yapay zeka eğitmenleri olarak adlandırılan kişilerin ChatGPT yanıtlarını derecelendirerek karşılaştırmasını kapsıyor. Yapay zeka modellerinin gelişmesiyle insan eğitmenler, yapay zeka modellerinin yaptıkları hataları tespit etmekte zorlanabiliyor.
Bu zorluğun üstesinden gelmek ve yapay zekasına daha fazla muhakeme yeteneği kazandırmak isteyen OpenAI, CriticGPT ile insan eğitmenlerin modelden bağımsız olarak daha kapsamlı eleştiriler yazmasına da olanak tanıyor.
Giderek daha karmaşık hala gelen yapay zeka sistemlerini uyumlu hale getirmek için daha iyi araçlar geliştirmeyi amaçlayan yapay zeka devi, RLHF'yi GPT-4'e uygulamanın insanların daha iyi veriler üretmesine yardımcı olduğuna inanıyor.
RLHF nedir, ne işe yarar❓
İnsan Geri Bildirimi ile Pekiştirmeli Öğrenme anlamına gelen RLHF, yapay zeka ve makine öğrenimi alanında modellerin performans kalitesini iyileştirmek ve daha doğru sonuçlar elde etmesini sağlamak için kullanılan bir tekniktir.
İnsan geri bildirimi modelin doğru stratejileri daha hızlı bir şekilde öğrenmesini sağlayan RLHF, hem yapay zeka sohbet robotlarının daha doğal ve insan benzeri yanıtlar vermesine hem de daha etkili, doğru ve insani değerlere uygun hale getirilmesine izin verir.
Popüler İçerikler