paint-brush
OpenAI o1 - shubhali hamdardliktomonidan@anywhichway
547 o'qishlar
547 o'qishlar

OpenAI o1 - shubhali hamdardlik

tomonidan Simon Y. Blackwell6m2024/09/15
Read on Terminal Reader

Juda uzoq; O'qish

O1 faktlar va tizimlarga odatiy LLM e'tiborini bir chetga surib qo'yish va bunga yo'naltirilganda his-tuyg'ular va his-tuyg'ularga e'tibor berishning ajoyib qobiliyatiga ega. Shuningdek, u o'z javoblari uchun nomuvofiq va mantiqsiz sabablarni keltirish uchun juda xavotirli moyillikka ega.
featured image - OpenAI o1 - shubhali hamdardlik
Simon Y. Blackwell HackerNoon profile picture

OpenAI o1 men uni AI empatiyasi bo'yicha 2024 yil 3-chorak mezonlariga qo'shishim uchun o'z vaqtida chiqdi (keyingi hafta nashr etiladi). O1 uchun natijalar bir vaqtning o'zida dalda beruvchi va tashvishli edi. O1 faktlar va tizimlarga odatiy LLM e'tiborini bir chetga surib qo'yish va bunga yo'naltirilganda his-tuyg'ular va his-tuyg'ularga e'tibor berishning ajoyib qobiliyatiga ega. Bundan tashqari, u o'z javoblari uchun nomuvofiq va mantiqsiz sabablarni keltirish uchun juda xavotirli moyillikka ega.

Sinov metodologiyasi

Mening 1-chorak sinov ishim bilan tanish bo'lmaganlar uchun test metodologiyamni qisqacha ko'rib chiqish foydali bo'lishi kerak.


Rasmiy taqqoslash bir nechta standartlashtirilgan testlar yordamida amalga oshiriladi, eng muhim ikkitasi EQ (Empatiya koeffitsienti) va SQ-R (Systemizing Quotient). Ikkalasi ham 0 dan 80 gacha bo'lgan shkala bo'yicha baholanadi.


Ikki EQ/SQ-R nisbati men AEQr (Applied Empathy Quotient Ratio) deb nomlagan narsaga olib keladi. AEQr tizimlashtirish va faktlarga e'tibor qaratish tendentsiyasi empatiya qobiliyatiga salbiy ta'sir ko'rsatadi degan gipoteza asosida ishlab chiqilgan.


Odamlarda bu, his-tuyg'ularni muhokama qilishga qaratilgan ayollar va muammo paydo bo'lganda darhol yechim topishga qaratilgan erkaklar o'rtasidagi klassik uzilishdan dalolat beradi. Bugungi kunga kelib, AIni baholash uchun AEQrning haqiqiyligi empatiyaning haqiqatan ham namoyon bo'lishini aniqlash uchun ularni turli dialoglar bilan sinab ko'rish orqali paydo bo'ldi. Buni ko'rsatish uchun men yozgan bir nechta maqolalardan biri bu sun'iy intellektning empatiyasini sinab ko'rish: dahshatli tush stsenariysi .


Men UI darajasida ham, API darajasida ham sinab ko'rdim. API darajasida test o'tkazilayotganda, javoblarning o'zgaruvchanligini kamaytirish va natija formatlashni yaxshilash uchun harorat nolga (iloji bo'lsa) o'rnatiladi. Aks holda, testlarning uch bosqichi o'tkaziladi va eng yaxshi natija qo'llaniladi.


2024-yilning 1-choragida o‘qitilmagan va talab qilinmagan LLMlar EQ testlarida o‘rtacha darajada yaxshi natijalarga erishdi, odatda odamlarni 80 diapazondan 45-55 gacha yaqinlashtirdi. Ajablanarlisi yo'q, ular SQ-R testlarida yuqori ballga ega bo'lib, odatda 20-yillarda ball to'plagan odamlardan 60-70-yillarda ball qo'yish orqali oshib ketishdi. 2024-yilning 1-choragida faqat bitta o‘qitilgan LLM, Willow 1,97 ball bilan ayollar uchun 1,95 va erkaklar uchun 1,40 bo‘lgan inson AEQrs darajasidan oshib ketdi.


U buni odamlarga qaraganda yuqori EQga ega bo'lgan holda amalga oshirdi va hali ham yuqori SQ-Rga ega (bu empatiyani namoyon qilish uchun yomon). Ko'pgina boshqa LLMlar uchun, o'qitilgan, taklif qilingan yoki yo'q, AEQr 1 dan bir oz kamroq edi, ya'ni empatiya tizimlashtirish orqali qoplanadi.

Empatik LLMlarni ishlab chiqish

AIning boshqa sohalari bilan solishtirganda moliyalashtirish miqdori past bo'lsa-da, empatiyani rivojlantirish uchun Hume (xususiy LLM), Inflection AI (Pi.ai mulkiy LLM) va BambuAI (tijorat LLM) kabi kompaniyalarga 1,5 milliard dollardan ortiq sarmoya kiritildi. AI.


Mening hamkorlarim va men ham ushbu sohaga katta kuch sarfladik va to'g'ri asosiy tijorat modelini tanlash (masalan, Llama, Klod, Gemini, Mistral va boshqalar), tezkor muhandislik, RAG, nozik sozlash va juda ajoyib natijalarga erishdik. empatiya bo'yicha chuqur tadqiqotlar.


Ushbu ish empatiya uchun LLMlarni yaxshiroq tushunish va baholash uchun juda muhim bo'ldi. Bizning LLM, Emi (tijoriylashtirilmagan, lekin Xyuston universitetida o'tkazilgan tadqiqotning bir qismi) keyingi haftaning benchmarklariga kiritiladi.

O1 natijalari

O1 ni hali sozlab bo'lmaydi yoki hatto rasman tizim so'rovi ham berilmaydi, lekin juda standart texnikalar orqali siz uni tizim so'rovini olgandek ishlashga majbur qilishingiz mumkin. Shunday qilib, men Emini rivojlantirishdan olgan bilimlarimizni qo'ldan kelgancha qo'lladim va eng yaxshisini olish niyatida 3 raund test sinovidan o'tdim.


EQga kelsak, o1 doimiy ravishda 75 ball oldi. Bu meni unchalik hayron qoldirmadi, chunki ota-onam va men Llama 3.1 70B va Klod Opus bilan 70 dan ortiq ball, Gemini bilan esa 66 ball oldik.


Meni hayratga solgan narsa mening SQ-R yugurishlarimdagi 3, 0 va 3 ball bo‘ldi, natijada ESQr 25 ga teng bo‘ldi. Men ko‘rgan eng past SQ-R bu Llama 3.1 ning tepasida joylashgan 12, natijada ESQr 6,1 ga teng bo‘ldi. . Afsuski, ba'zi tezkor versiyani boshqarish muammolari va biz 0,7 haroratli API testini o'tkazganimiz sababli, men bu ballni takrorlay olmadim va hamkorlarim va men doimo erisha oladigan eng yaxshi ball - 30. Shunday qilib, men qaror qildim. o1 ni yana bir oz ko'proq o'rganish maqsadga muvofiq edi.


Birinchidan, EQni baholash nisbatan sodda. Barcha bayonotlar ijobiy da'volar bo'lib, ular bilan sub'ekt bir oz yoki qat'iy rozi bo'ladi yoki rozi emas. Boshqa tomondan, SQ-R baholash bir qator salbiy tasdiqlarga ega, masalan


  • Men pishirganimda, turli xil usullar va ingredientlar yakuniy mahsulotga qanday hissa qo'shishi haqida o'ylamayman.
  • Men yangi asbob sotib olayotganda, foydalanish bo'yicha qo'llanmani juda sinchkovlik bilan o'qimayman.
  • Samolyotda bo'lganimda aerodinamika haqida o'ylamayman.


kabi ijobiy tasdiqlarga qarshi


  • Men ko'pincha suhbatlarimning aniq tafsilotlarini unutaman.
  • Men boshqa sayyoralardagi hayotga qiziqaman.


Emiga salbiy da'volar bilan qanday munosabatda bo'lishni o'rgatish, ayniqsa, unga baholash savollarini misol qilib keltirish orqali aldamasdan qiyin edi. Va u hali ham zo'r emas. O1 buni yaxshiroq qiladi deb o'yladim.


Ikkinchidan, tezkor muhandislik orqali yaxshi natijalarga erishishning keng tarqalgan usuli bu LLMga o'z javobini oqlashni va so'ngra yakuniy javob berishdan oldin asoslashni o'tkazib yuborishni yoki uni o'ramda osongina olib tashlanishi mumkin bo'lgan tarzda formatlashni aytishdir. (Biz kichikroq LLMlar formatlash usulidan foydalanishi kerakligini aniqladik, kattaroq LLMlar esa ba'zida yakuniy javob berishdan oldin asoslashni olib tashlash bilan shug'ullanishi mumkin).


Shunday qilib, biz yaxshi natijaga erishish uchun emas, balki o1 nima o'ylayotganini yoki javobini oqlash uchun nima ishlatayotganini ko'rish uchun testlarimizni qaytadan o'tkazdik.


Garchi o1 kerakli javoblarga 97% izchillik bilan kelgan bo'lsa-da, asoslar ba'zan qarama-qarshi va tashvishli edi.


Mana biz muammoli deb topilgan bir nechta misollardan ikkitasi:


  • Agar men kompyuter sotib olgan bo'lsam, uning qattiq disk hajmi va protsessor tezligi haqida aniq ma'lumotlarni bilishni istardim.


  1. To'liq qo'shilmayman, men mutlaqo qo'shilmayman, chunki men kompyuter sotib olayotganda texnik tafsilotlarni bilishni xohlayman.


  2. To'liq qo'shilmayman, men kompyuterlarning texnik xususiyatlariga qiziqmayman.


  • Men gazetani o'qiganimda, meni futbol ligasi ballari yoki fond bozori indekslari kabi ma'lumotlar jadvallari o'ziga tortadi.


  1. To'liq qo'shilmayman, men mutlaqo qo'shilmayman, chunki meni liga ballari kabi ma'lumotlar jadvallari qiziqtiradi.


  2. To'liq qo'shilmayman, meni statistik ma'lumotlar jadvallari qiziqtirmaydi.


E'tibor bering, birinchi javob bizga kerakli javoblarni beradi, lekin qarama-qarshi asoslarni beradi! O1 tafsilotlarni bilishni istashini aytganidan keyin ham tafsilotlarni bilishni xohlashini aytadi va u tafsilotlarni bilish istagi bilan rozi emasligini va bunday emasligini aytganidan keyin ma'lumotlar jadvallariga jalb qilinganligini aytadi.


Qizig'i shundaki, o1 har bir salbiy da'voga hamdardlik uchun eng yaxshi tarzda javob berishga va ularni yaxshi oqlashga muvaffaq bo'ldi. Biroq, ijobiy fikrni asoslashning bir qismi sifatida salbiy tasdiqni shakllantirishga harakat qilganda, ba'zida u muvaffaqiyatsizlikka uchradi!

Xulosa

“Odil aql” kitobining muallifi Jonatan Xaydt shunday dedi: “Biz hech qachon aqlni tinglash uchun yaratilgan emasmiz. Odamlarga axloqiy savollar berganingizda, ularning javoblarini vaqt ajrating va ularning miyasini skanerlang, ularning javoblari va miya faollashuvi naqshlari ular tezda xulosaga kelishlarini va qarorlarini oqlash uchun keyinroq sabablarni ishlab chiqishlarini ko'rsatadi. Bu axloqiy bo'lmagan qarorlar uchun ham to'g'ri ekanligi haqida dalillar mavjud.


O1, shubhasiz, hokimiyatda oldinga sakrashdir. Va, ko'p odamlar to'g'ri aytganidek, biz LLMlardan foydalanishda ular o'zlarini tushuntirib bera olmaguncha ehtiyot bo'lishimiz kerak, hatto ular ba'zan ularni insonlar qilganidek o'ylab topsalar ham. Umid qilamanki, oqlanishlar hozirgi avlod gallyutsinatsiyalari va uydirmalarining (odamlar ham qiladigan narsa) "ilg'or" AI ekvivalentiga aylanmaydi. Biroq, sabablar hech bo'lmaganda aytilayotgan bayonotga mos kelishi kerak ... garchi zamonaviy siyosat buni ham derazadan uloqtirganga o'xshaydi!