paint-brush
iAsk AI AIning eng qiyin mezonida aniqlik rekordlarini yangiladitomonidan@missinvestigate
Yangi tarix

iAsk AI AIning eng qiyin mezonida aniqlik rekordlarini yangiladi

tomonidan Miss Investigate3m2024/11/13
Read on Terminal Reader

Juda uzoq; O'qish

iAsk AI ning ilg‘or modeli iAsk Pro murakkab, bitiruv darajasidagi ilmiy muammolarni hal qilishda aniqlik bo‘yicha yangi rekordlarni o‘rnatdi.
featured image - iAsk AI AIning eng qiyin mezonida aniqlik rekordlarini yangiladi
Miss Investigate HackerNoon profile picture

Qidiruv mexanizmlari ma'lumot qidirishda ustunlik qiladi, ammo iAsk AI nima mumkin bo'lganini qayta aniqlaydi. GPQA Diamond benchmarkidagi yangi yutuqda iAsk AI ning ilg‘or modeli iAsk Pro murakkab, bitiruv darajasidagi ilmiy muammolarni hal qilish bo‘yicha aniqlik bo‘yicha yangi rekordlarni o‘rnatdi. Bu shunchaki texnik bosqich emas — bu sun’iy intellekt insonga o‘xshash chuqurlik va aniqlik bilan murakkab savollarni qanday tushunishi, qayta ishlashi va javob berishi mumkinligini qayta tasavvur qilishdir.


GPQA Benchmark nima?


GPQA (Graduate-Level Google-Proof Q&A Benchmark) AI modellari uchun biologiya, fizika va kimyo kabi sohalarda ularni sinovdan o'tkazish uchun mo'ljallangan eng jiddiy testlardan biridir. Bu odatiy savollar emas; ular bilim va nuansli, ko'p bosqichli fikrlashni talab qiladilar, bu hatto doktorlik darajasidagi mutaxassislarni ham hayratda qoldirishi mumkin. E'tiborlisi, iAsk Pro GPQA Diamond quyi to'plami bo'yicha rekord darajadagi 78,28% aniqlikka erishdi - bu benchmarkning eng qiyin 198 savolidan iborat - OpenAI'ning GPT va Anthropic's Claude 3.5 kabi etakchi modellaridan ustun keldi. Ushbu yutuq sun'iy intellektning eng qiyin, eng murakkab so'rovlarni hal qilish qobiliyatida yangi standartni o'rnatadi.


Umumiy mezonlardan farqli o'laroq, GPQA oddiy javoblarga qarshilik ko'rsatadigan "Google tomonidan tasdiqlangan" savollarga e'tibor qaratadi. Bu savollar ilg'or fikrlashni talab qiladi, ya'ni inson mutaxassislari bilan raqobatlashadi. Murakkablik shunchalik yuqoriki, hatto ixtisoslashgan mutaxassislar ham odatda o'rtacha 65% aniqlikka ega. iAsk Pro-ning yutuq aniqligi uning insonning kognitiv qayta ishlash chuqurligini aks ettirishning noyob qobiliyatini aks ettiradi va uni AI landshaftida ajratib turadi.


iAsk AI qanday qilib tengsiz aniqlikka erishadi


Kalit so'zlarni moslashtirishga tayanadigan standart qidiruv tizimlaridan farqli o'laroq, iAsk Pro yondashuvi ancha chuqurroqdir. U murakkab, ko'p qatlamli savollarni bosqichma-bosqich dekonstruksiya qilish uchun fikrlash zanjiri (CoT) asoslaridan foydalanadi. Bu usul inson mantig'ini aks ettiradi va iAsk Pro-ga juda aniq va kontekstga mos javoblarni taqdim etish imkonini beradi. Foydalanuvchilar iAsk Pro-ning aniqlikka sodiqligini ta'kidlab, noaniq havolalar o'rniga har tomonlama, aniq javoblar oladi.


Kalit so'zlarni moslashtirishga tayanadigan standart qidiruv tizimlaridan farqli o'laroq, iAsk Pro yondashuvi ancha chuqurroqdir. U murakkab, ko'p qatlamli savollarni bosqichma-bosqich dekonstruksiya qilish uchun fikrlash zanjiri (CoT) asoslaridan foydalanadi. Bu usul inson mantig'ini aks ettiradi va iAsk Pro-ga juda aniq va kontekstga mos javoblarni taqdim etish imkonini beradi. Foydalanuvchilar iAsk Pro-ning aniqlikka sodiqligini ta'kidlab, noaniq havolalar o'rniga har tomonlama, aniq javoblar oladi.


GPQA benchmarki AI modellarini sirt darajasidagi bilimlardan tashqari sinovdan o'tkazish uchun maxsus ishlab chiqilgan bo'lib, ilg'or fikrlashni talab qiladi. iAsk-ning ushbu qiyin mezonga e'tibor qaratish tanlovi strategik bo'lib, o'z imkoniyatlarini akademiya, tadqiqot va boshqa ma'lumotlarga asoslangan domenlar kabi sohalarda namoyish etdi. Yuqori GPQA aniqligi bilan iAsk Pro ilg'or bilim sohalarida o'zini bebaho resurs sifatida namoyon etib, chuqur ilmiy tushunishni talab qiladigan sohalarda yutuqlarga erishishga tayyor.


iAsk Pro bilan sun'iy intellekt asosidagi bilimlarning kelajagi


Professionallar, akademiklar va aniqlikni qadrlaydigan har bir kishi uchun iAsk Pro sunʼiy intellekt asosidagi soʻrovning yangi davrini eʼlon qiladi. Uning rekord darajadagi ishlashi texnologiya nafaqat ma'lumot olishda yordam beradigan, balki jamoaviy tushunishni faol ravishda rivojlantiradigan kelajakka ishora qiladi. Ilmiy kashfiyotlarni qo‘llab-quvvatlashdan tortib foydalanuvchilarga aniq bilimlarning ishonchli manbasini taklif qilishgacha, iAsk AI qidiruv texnologiyasining hayotimizdagi rolini qayta shakllantirmoqda.


iAsk Pro muvaffaqiyati AI sari qadamni ifodalaydi, u odamlar bilan bir qatorda muammoni hal qiluvchi, inson so'rovining chuqurligi va murakkabligini hal qilishga qodir.



Ushbu maqola HackerNoon's Business Blogging dasturi ostida nashr etilgan. Bu yerda dastur haqida ko'proq bilib oling.


L O A D I N G
. . . comments & more!

About Author

Miss Investigate HackerNoon profile picture
Miss Investigate@missinvestigate
We are a global analytics and advisory firm grounded in our public opinion survey research expertise.

TEGI QILISH

USHBU MAQOLA TAQDIM ETILGAN...