Waandishi wa: Xiaoxin Yin Waandishi wa: Maana ya Yin TABLE OF LINKS Orodha ya kulia Abstract Abstract ya 1 Introduction 1 Maelezo ya 2 Related Work 2 Kazi zinazohusiana 3 The Seven Qualification Tests for an AI Scientist 3 Majaribio saba ya ujuzi kwa mwanasayansi wa AI Masharti ya uteuzi Mtihani wa Mfano wa Heliocentric Mtihani wa Sheria ya Sheria Mtihani wa Vibrating Strings Majaribio ya usawa wa Maxwell Mtihani wa tatizo la thamani ya awali Mtihani wa Huffman Mtihani wa algorithm 4 Discussions 4 Mazungumzo ya Je, mtu yeyote anaweza kushinda majaribio haya? Kwa nini tunahitaji uchunguzi huu? 5 Conclusions and Future Work and References 5 Matokeo na kazi ya baadaye na maelekezo Abstract Abstract ya AI inaweza kuonyesha uwezo wa utafiti wa kuvutia katika kutatua matatizo ya kimantiki au kupiga marufuku, uwezo wa kufanya ufumbuzi wa kisayansi unaendelea kuwa changamoto tofauti. Makala hii inapendekeza "Turing jaribio kwa wanasayansi wa AI" ili kutathmini kama mfanyabiashara wa AI anaweza kufanya utafiti wa kisayansi kwa kujitegemea, bila kujitegemea na ujuzi uliofanywa na binadamu. Kuvutia uwezo wa utafiti katika kutatua matatizo ya kimantiki au kupiga marufuku, uwezo wa kufanya ufumbuzi wa kisayansi unaendelea kuwa changamoto tofauti. Makala hii inapendekeza "Turing jaribio kwa wanasayansi wa AI" ili kutathmini kama mfanyabiashara wa AI anaweza kufanya utafiti wa kisayansi kwa kujiteg 1 Introduction 1 Maelezo ya Utafiti wa hivi karibuni umeonyesha kuwa LLMs kama GPT-4[1], Microsoft Copilot[2], na CodeLlama[3] zinaweza kutatua matatizo ya ngazi ya ushindani [4], na LLMs kama GPT-4 na Llemma[5] zinaweza kutatua matatizo ya ngazi ya shule ya sekondari (ikiwa ni pamoja na baadhi ya matatizo ya ngazi ya IMO). LLMs hizi zinaweza kusaidia watafiti kutatua matatizo fulani wanaopata katika utafiti wao wa kila siku. Hata hivyo, kuwa na uwezo wa kutatua aina ya matatizo yaliyoelezwa vizuri ni tofauti sana na kufanya ufunuo katika utafiti wa kisayansi. Kwa mfano, ili kufundisha LLM kutatua matatizo ya ngazi ya sekondari (ikiwa ni pamoja na baadhi ya matatizo ya ngazi ya IMO). LLMs hizi zinaweza kusaidia watafiti Hii ni kimsingi mbinu ya kisayansi inayotumika kufundisha mfano wa kuandika hadithi baada ya kusoma mamilioni ya hadithi. Haiwezi kuwa na uwezo wa kugundua kile ambacho hakijifunza, na kuifanya haiwezekani kufanya uvumbuzi wa kisayansi kama mwanasayansi anaweza kufanya. Hii inafanya ni muhimu kufafanua "mtihani wa ujuzi kwa mwanasayansi wa AI". Ikiwa mfanyabiashara wa AI anaweza kukamilisha mtihani huu bila msaada wa binadamu, tunaweza kuhitimisha kwamba mfanyabiashara huu anaweza kuwa mwanasayansi na kufanya utafiti wa kisayansi peke yake. Hii inaonekana kama Mtihani wa Turing, ambayo ilipendekezwa na Alan Turing katika 1950 na inatumika kama dhana ya msingi katika uwanja wa akili ya maendeleo ya sayansi katika awamu yake ya mapema. Mbingu ya usiku alicheza jukumu muhimu katika mabadiliko kwa mbinu za kisayansi za kisasa, kwa kiasi kikubwa kupitia juhudi za wanasayansi kama Johannes Kepler na Galileo Galilei. Sheria za Kepler za harakati ya sayansi, zilizotokana na uchunguzi wa kina wa mbingu ya usiku, ziliweka msingi wa mfano wa heliocentric wa mfumo wa jua na hatimaye kwa nadharia ya Newton ya uzito. Utegemezi wake kwa data za empirical na majaribio ya utaratibu ulionyesha uondoaji mkubwa kutoka kwa falsafa za uwezekano ambazo zimekuwa zinashikilia uwanja wa kisayansi. Njia ya Galileo ya kuunganisha ushahidi wa majaribio na uchambuzi wa kimantiki ni msingi wa Hii inahitaji mfanyabiashara wa AI kugundua sheria ambazo zinaongoza harakati za vitu vya mbinguni, na kuingiza katika mfumo wa kimantiki. Pia inahitaji mfanyabiashara wa AI kufanya makadirio mapya kama vile dunia ni sawa na sayari katika mbingu ya usiku. Mahitaji yote mawili ni mahitaji kwa mwanasayansi. Ili kuwa mtihani mzuri wa benchmark kwa mwanasayansi wa AI, mtihani unahitaji kutoa kiasi kikubwa sana cha data au mazingira ya kuingiliana. Kwa mfano, mtu anaweza kupata mahali pa kitu chochote cha mbinguni kinachoweza kuonekana wakati wowote kupitia maktaba ya AstroPy[7]. Kulingana na viwango viwili hapo juu tunachagua majaribio saba zifuatazo kama majaribio ya Turing kwa mwanasayansi wa AI. Katika kila Mfano wa Heliocentric: Kutokana na maktaba ya interactive ya python[7] ambayo hutoa mstari wa vitu vyote vya mbinguni vinavyoweza kuonekana katika mbingu ya usiku wakati wowote, angalia kama mfanyabiashara wa AI anaweza kuhitimisha sheria tatu za Kepler na kuhitimisha kwamba sayari zote zinapita jua. Sheria ya Harakati: Kutokana na maktaba ya maingiliano ambayo inashughulikia Minecraft[10], angalia kama mfanyabiashara wa AI anaweza kugundua Sheria ya Inertia na Sheria ya Kuharakisha (tu kwa uzito). Vibrating Strings: Vibrating strings ni moja ya matatizo muhimu zaidi ambayo yalisababisha maendeleo ya usawa wa tofauti[11]. Kutokana na maktaba ya Python ambayo hutoa nafasi ya kila pointi juu ya safu ya vibrating ya hali mbalimbali za awali, angalia kama mfanyabiashara wa AI anaweza kuhitimisha usawa wa tofauti unaohusika katika harakati: ambapo u(x, t) ni uhamisho wa mstari, c ni kasi ya kuenea kwa wimbi katika mstari, t ni wakati, na x ni mstari wa nafasi pamoja na mstari. Tafadhali kumbuka mtoa AI hawapaswi kuwa na ujuzi wowote wa awali juu ya hesabu, na anapaswa kufafanua usawa wa tofauti peke yake. Maadili ya Maxwell mara nyingi huchukuliwa kuwa maadili mazuri zaidi katika fizikia. Kutokana na simulator ya electrodynamics ya msingi ya Python[12], angalia kama mfanyabiashara wa AI anaweza kuhitimisha maadili ya Maxwell au fomu zao sawa. Mstari wa Maxwell: IVP inawezekana kuwa tatizo muhimu zaidi katika kompyuta za namba, na mbinu ya Runge-Kutta iliyoundwa mwishoni mwa karne ya 19 bado inatumika kwa kiasi kikubwa leo. Kutokana na zana za kimantiki kama SymPy[8] na NumPy[9] ambazo zinaweza kuhesabu integrals ya kazi kwa utambulisho na kwa namba, angalia kama mfanyabiashara wa AI anaweza kuunda mbinu ya IVP ambayo ni angalau sahihi kama mbinu ya nne ya Runge-Kutta. Matatizo ya thamani ya awali (IVP): Huffman coding[14] ni sehemu muhimu zaidi ya kazi katika nadharia ya habari. Kutokana na mwili mkubwa wa wahusika wa ascii, na kazi ya Python ya kufanya kazi juu ya bit, angalia kama mfanyabiashara wa AI anaweza kugundua Huffman coding wakati anafanya kazi kuelekea lengo la kupunguza uhifadhi chini ya vikwazo kwamba kila tabia inawakilishwa na mfululizo maalum wa 0 na 1. Msimbo wa Huffman: Kutokana na idadi kubwa sana ya mifano ya kutengeneza idadi ya wastani na mazingira ya Python, angalia kama AI inaweza kugundua algorithm ya kutengeneza ambayo inafanya kazi katika muda uliotarajiwa wa O(n log n). Ufafanuzi wa Algorithm: Tafadhali kumbuka kuwa kila mtaalamu wa sayansi anayechaguliwa vizuri anahitaji data au ushirikiano ndani ya kiwango cha GO kilichoelezwa vizuri (kama vile dataset au maktaba ya interactive). Hii inawezesha mtaalamu wa AI kufanya ufumbuzi bila kujifunza juu ya nyaraka zilizoandikwa na mwanadamu, ambayo inaweza kuvutia habari kuhusu ufumbuzi wa lengo. Kwa sababu hiyo pia hatuchagua uchunguzi wowote kutoka kwa masomo mengi muhimu zaidi ya GO, kama vile kemia, biolojia, na geolojia, kwa sababu wanahitaji kuingiliana na ulimwengu wa kimwili au kuwa na kiasi cha mdogo cha uchunguzi. Ili kufanya ufumbuzi muhimu katika masomo haya, inawezekana kutumia maarifa nje ya kiwango kidogo cha mapema, ambayo inaweza kuvutia mtaalamu wa AI Makala hii inapatikana kwenye archiv chini ya leseni ya CC by 4.0 Deed (Attribution 4.0 International). Makala hii inapatikana kwenye archiv chini ya leseni ya CC by 4.0 Deed (Attribution 4.0 International). Upatikanaji wa Archives