Yazarlar:
(1) Herbie Bradley, CarperAI, CAML Laboratuvarı, Cambridge Üniversitesi ve EleutherAI;
(2) Andrew Dai, Alef Alfa;
(3) Hannah Teufel, Aleph Alpha;
(4) Jenny Zhang, 5Bilgisayar Bilimleri Bölümü, British Columbia Üniversitesi ve Vektör Enstitüsü;
(5) Koen Oostermeijer, Aleph Alpha;
(6) Marco Bellagente, Stabilite AI;
(7) Jeff Clune, Bilgisayar Bilimleri Bölümü, British Columbia Üniversitesi, Vektör Enstitüsü ve Kanada CIFAR AI Başkanı;
(8) Kenneth Stanley, Maven;
(9) Grégory Schott, Aleph Alpha;
(10) Joel Lehman, Stokastik Laboratuvarlar.
Özet ve Giriş
Arka Plan ve İlgili Çalışmalar
Yaklaşmak
Yaratıcı Yazarlık Alanında Denemeler
Tartışma ve sonuç
Ek
Çoğu metin oluşturma probleminde, kullanıcılar yalnızca tek bir yanıtı değil, aralarından seçim yapabilecekleri çeşitli yüksek kaliteli çıktıları da tercih edebilirler. Kalite çeşitliliği (QD) arama algoritmaları, aday popülasyonunu sürekli olarak geliştirip çeşitlendirerek bu tür sonuçları hedefler. Bununla birlikte, QD'nin yaratıcı yazarlık gibi niteliksel alanlara uygulanabilirliği, kalite ve çeşitlilik ölçütlerini algoritmik olarak belirlemenin zorluğu nedeniyle sınırlanmıştır. İlginç bir şekilde, dil modellerindeki (LM'ler) son gelişmeler, yapay zeka geri bildirimi aracılığıyla aramanın yönlendirilmesini mümkün kıldı; burada LM'ler, metnin niteliksel yönlerini değerlendirmek için doğal dilde yönlendiriliyor. Bu gelişmeden yararlanarak, Yapay Zeka Geri Bildirimi (QDAIF) yoluyla Kalite Çeşitliliğini tanıtıyoruz; burada evrimsel bir algoritma, hem çeşitlilik oluşturmak hem de aday metnin kalitesini ve çeşitliliğini değerlendirmek için LM'leri uyguluyor. Yaratıcı yazma alanlarında değerlendirildiğinde QDAIF, QD olmayan kontrollere göre yüksek kaliteli örneklerle belirli bir arama alanının daha fazlasını kapsar. Ayrıca, QDAIF tarafından oluşturulan yaratıcı metinlerin insan tarafından değerlendirilmesi, yapay zeka ile insan değerlendirmesi arasındaki makul anlaşmayı doğrular. Dolayısıyla sonuçlarımız, yapay zeka geri bildiriminin, yaratıcı ve orijinal çözümler için açık uçlu araştırmalara rehberlik etme potansiyelini vurguluyor ve görünüşte birçok alan ve modaliteye genellenen bir tarif sağlıyor. Bu sayede QDAIF, insan toplumunun inovasyon kapasitesinin altında yatan temel beceriler arasında yer alan, bağımsız olarak arama yapabilen, çeşitlendirebilen, değerlendirebilen ve geliştirebilen yapay zeka sistemlerine doğru atılmış bir adımdır.[1]
İnsan inovasyonu yalnızca yaratıcılık için üretken bir kapasite değildir, aynı zamanda yeni fikirlerin ve eserlerin öznel kalitesini değerlendirme yeteneğini de içerir. Harika fikirler nadiren bir anda ve bütünüyle üretilir; bunun yerine, farklı detaylandırma ve revizyon zincirleri yoluyla yavaş yavaş ortaya çıkar (Stanley ve Lehman, 2015). Böyle bir fikir ağacında başarılı bir şekilde gezinmek için yaratıcının, zincirdeki hangi adımların daha fazla takip edilmeye değer olduğunu değerlendirmesi gerekir; bu, özellikle sanatsal veya edebi boyutları olan alanlarda oldukça öznel olabilen bir sorudur.
Şimdiye kadar, yapay zeka adaylar sağlayabilse bile, bu tür subjektif değerlendirmeler için umut kesin olarak insanlardaydı. Ancak son yıllarda ortaya çıkan temel model teknolojisi (Bommasani ve diğerleri, 2021), artık değerlendirmenin kısmen öznel olduğu durumlarda bile modelin değerlendirici rolünü de oynayabileceği anlamına geliyor (Madaan ve diğerleri, 2023). Bu şekilde, ilk kez, çeşitli ilginç eserler ortaya çıkaran tüm bir fikir süreci prensipte otomatikleştirilebiliyor. Bu süreç, LM'ler tarafından tamamen kendi başına yürütülemez, ancak bir arama algoritmasının model çağrılarıyla incelikli bir şekilde birbirine zincirlenmesini gerektirir. Bu makale, bu potansiyele ulaşmanın bir yolunu vurgulamaktadır: LM'leri, bir tasarım alanını kapsayan yüksek kaliteli çözümler üreten arama süreçlerinin nasıl tasarlanacağına odaklanan kalite çeşitliliği (QD) alanıyla (Mouret ve Clune, 2015) birleştirmek. .
QD algoritmalarındaki ana fikir, yüksek kaliteli çeşitli yanıtları açıkça korumak ve aramaktır. Tipik olarak bu tür arama algoritmaları, elle tasarlanmış çeşitlilik ve kalite ölçümlerinin yanı sıra anlamlı çeşitlilik oluşturmanın bir yolunu gerektirir. Ancak en ilginç ve karmaşık alanlar neredeyse her zaman subjektif veya algoritmik olarak belirlenmesi zor olan performans, çeşitlilik ve varyasyon kavramlarını içerir. LM'ler aracılığıyla çeşitlilik yaratan (Lehman ve diğerleri, 2022; Meyerson ve diğerleri, 2023) ve LM'ler aracılığıyla potansiyel çözümlerin kalitesini değerlendiren (Ahn ve diğerleri, 2022) çalışmaları genişleterek, LM'lerin değerlendirme için de kullanılabileceğini gösteriyoruz. çeşitliliğin niteliksel yönleri. Bu şekilde LM'ler, QD aramasının üç ana bileşenini somutlaştırabilir ve böylece Yapay Zeka Geri Bildirimi (QDAIF) yoluyla Kalite Çeşitliliği adını verdiğimiz, sürekli LM ilerlemelerinin arka planını takip edebilen güçlü yeni QD algoritmalarını etkinleştirebilir. Bu tür QDAIF, modelin ince ayarına ihtiyaç duymadan, daha sezgisel çeşitlilik önlemleri yoluyla bir LM istemine çeşitli, yüksek kaliteli yanıtları keşfedebilir ve geri getirebilir (ancak LM'lerin ince ayar üreterek kendi kendini geliştirmesi için de kullanılabilir) veriler (Lehman ve diğerleri, 2022; Chen ve diğerleri, 2023)), oluşturulan veriler aracılığıyla kendi kendine küratörlüğünü yaptığı etkili öğrenme ortamları için yapay zeka üreten algoritmalara doğru ilginç bir yön (Clune, 2019)).
QDAIF'i üç yaratıcı yazma alanında değerlendiriyoruz: görüş yazımı, kısa öyküler ve şiir. Buradaki fikir, bu tür yaratıcı alanlarda kullanıcıların genellikle aralarından seçim yapabilecekleri veya ilham alabilecekleri çok çeşitli olası öykü veya şiirleri görmekten keyif almasıdır. Nicel sonuçlar, QDAIF'in mevcut temel çizgilerden önemli ölçüde daha iyi performans gösterdiğini göstermektedir. Ek olarak, insan değerlendirmesi yoluyla, insan ve yapay zeka tarafından oluşturulan geri bildirimler arasında güçlü bir uyum gözlemliyoruz; bu, yapay zeka geri bildiriminin temellendiğine ve yöntemin pratikte işe yarayabileceğine (yani insanlar tarafından ölçüldüğü üzere gelişmiş kalite ve çeşitlilik sağladığına) dair ampirik kanıtlar sağlıyor. Genel olarak QDAIF, insanların kültür ve bilim yaratmalarına olanak tanıyan temel yeteneklerinden biri olan, bağımsız olarak arama yapabilen ve yenilik yapabilen yapay zeka modellerine bizi bir adım daha yaklaştırıyor (Stanley ve diğerleri, 2017).
[1] Proje Sayfası: https://qdaif.github.io/
Bu makale arxiv'de CC 4.0 lisansı altında mevcuttur.