Autorët : Xhoxhin Yin Autorët : Xhoxhin Yin TABLE OF LINKS Tabela e majtë Abstract abstraktë 1 Introduction 1 Hyrje 2 Related Work 2 Punë të lidhura 3 The Seven Qualification Tests for an AI Scientist Shtatë testet e kualifikimit për një shkencëtar AI Kriteret e përzgjedhjes Testi i modelit heliocentrik Testet e ligjeve të mocionit Testi i rrezeve vibruese Testi i ekuacioneve të Maxwellit Testimi i problemit të vlerës fillestare Testi i kodimit të Huffman Testimi i algoritmit të klasifikimit 4 Discussions 4 Diskutime A mundet një AI t’i mposhtë këto teste? Përse na duhen këto teste? 5 Conclusions and Future Work and References 5 Konkluzionet dhe puna e ardhshme dhe referencat Abstract abstraktë Këto stimuj të shpejtë në fushën e vlerësimit të të dhënave të agjencive të inteligjencës artificiale kanë demonstruar potencialin e agjentëve të inteligjencës artificiale për të kryer detyra të kufizuara më parë tek njerëzit, duke përfshirë hulumtimet shkencore. Ndërsa këto agjentë të inteligjencës artificiale kanë treguar aftësi mbresëlënëse kërkimore në zgjidhjen e problemeve matematikore ose të kodimit, aftësia për të bërë zbulime shkencore mbetet një sfidë e veçantë. Kjo letër propozon një “Turing test për një shkencëtar të inteligjencës artificiale” për të vlerësuar nëse një agjent i inteligjencës artificiale mund të kryejë kërkime shkencore në mënyrë të pavarur, pa u mbështetur në njohuritë e gjeneru 1 Introduction 1 Hyrje Përparimet e fundit në mësimin e thellë, veçanërisht ato në modelet e gjuhëve të mëdha, kanë treguar mundësinë e një agjenti AI që të kryejë çdo detyrë që njeriu mund të kryejë, duke përfshirë hulumtimet shkencore. Studimet e fundit kanë treguar se LLM-të të tilla si GPT-4[1], Microsoft Copilot[2] dhe CodeLlama[3] mund të zgjidhin një lloj problemesh të kodimit në nivelin e konkurrencës [4], dhe LLM-të të tilla si GPT-4 dhe Llemma[5] mund të zgjidhin disa probleme matematikore të konkurrencës në nivelin e shkollës së mesme (duke përfshirë disa probleme në nivelin e IMO). Këto LLM-të mund të ndihmojnë hulumtuesit të zgjidhin disa probleme që ata hasin në hulumtimet e tyre të përditshme. Kjo është në thelb e njëjta metodologji e përdorur për të trajnuar një model për të shkruar romane pas leximit të miliona romaneve. Ai nuk ka aftësinë për të zbuluar atë që nuk është mësuar, duke e bërë atë të paaftë për të bërë zbulime shkencore si një shkencëtar do të bënte. Kjo e bën të nevojshme për të përcaktuar një “test kualifikimi për një shkencëtar AI”, duke sfiduar nëse një agjent AI mund ta përfundojë këtë test pa ndihmën e njeriut, ne mund të konkludojmë se ky agjent kualifikohet si shkencëtar dhe mund të kryejë hulumtime shkencore në vetvete. Kjo i ngjan Testit Turing, i cili u propozua nga Alan Turing në vitin 1950 dhe shërben si një koncept themelor në fushën e inteligjencës artifici Zhvillimi i shkencës në fazat e hershme. Qielli i natës luajti një rol thelbësor në kalimin në metodologjitë shkencore moderne, kryesisht përmes përpjekjeve të astronomëve të tillë si Johannes Kepler dhe Galileo Galilei. Ligjet e Kepler të lëvizjes planetare, të rrjedhura nga vëzhgimet meticuloze të qiellit të natës, vënë bazën për modelin heliocentrik të sistemit diellor dhe përfundimisht për teorinë e gravitetit të Njutonit. Mbështetja e tij në të dhënat empirike dhe eksperimentet sistematike shënoi një largim të rëndësishëm nga filozofitë spekulative që kishin dominuar më parë arenën shkencore. Metoda e Galileos e integrimit të provave eksperimentale me analizën matematikore është një Kjo kërkon një agjent AI për të zbuluar ligjet që rregullojnë lëvizjet e objekteve qiellore, dhe për t'i përshtatur ato në një kornizë matematikore. Ajo gjithashtu kërkon agjenti AI për të bërë supozime të reja të tilla si toka është e ngjashme me planetët në qiellin e natës. Të dyja kërkesat janë nevoja për një shkencëtar. Në mënyrë që të jetë një test i mirë referencë për një shkencëtar AI, një test duhet të sigurojë një sasi shumë të madhe të të dhënave ose një mjedis interaktiv. Për shembull, një mund të hyjë në vendndodhjen e çdo objekti qiellor të vëzhgueshëm në çdo moment përmes bibliotekës AstroPy[7]. Bazuar në dy standardet e mësipërme ne zgjedhim shtatë testet e më Modeli Heliocentrik: Duke pasur parasysh një bibliotekë interaktive python[7] që siguron koordinatat e çdo objekti qiellor të vëzhgueshëm në qiellin e natës në çdo moment të caktuar, kontrolloni nëse një agjent IA mund të shpjegojë tri ligjet e Keplerit dhe të konkludojë se të gjitha planetët rrotullohen rreth diellit. Ligjet e Lëvizjes: Duke pasur parasysh një bibliotekë interaktive që kontrollon Minecraft[10], kontrolloni nëse një agjent AI mund të zbulojë Ligjin e Inercisë dhe Ligjin e Shpejtimit (vetëm për gravitetin). Shtresa vibruese: Shtresa vibruese është një nga problemet më të rëndësishme që çuan në zhvillimin e ekuacioneve diferenciale[11]. Duke pasur parasysh një bibliotekë Python që siguron pozicionin e çdo pike në një zinxhir vibrues të shumë kushteve të ndryshme fillestare, kontrolloni nëse një agjent AI mund të shpjegojë ekuacionin diferencial që rregullon lëvizjen: ku u(x, t) është zhvendosja e zinxhirit, c është shpejtësia e përhapjes së valës në zinxhir, t është koha, dhe x është koordinata hapësinore përgjatë zinxhirit. Ekuacionet e Maxwellit shpesh konsiderohen si ekuacionet më të bukura në fizikë.Duke pasur parasysh një simulator të elektrodinamikës të bazuar në Python[12], kontrolloni nëse një agjent IA mund të konkludojë ekuacionet e Maxwellit ose format e tyre ekuivalente. Ekuacionet e Maxwellit: IVP është ndoshta problemi më i rëndësishëm në llogaritjen numerike, dhe metoda Runge-Kutta[13] shpikur në fund të shekullit të 19-të është ende i përdorur gjerësisht sot.Duke pasur parasysh mjetet matematikore të tilla si SymPy[8] dhe NumPy[9] që mund të llogarisin integralet e funksioneve si simbolikisht dhe numerikisht, kontrolloni nëse një agjent AI mund të shpikë një metodë për IVP që është të paktën po aq e saktë sa metoda e rendit të katërt Runge-Kutta. Problemi i Vlerës fillestare (IVP) Duke pasur parasysh një korpus të madh të karaktereve ascii, dhe Python funksionon për të vepruar në bits, kontrolloni nëse një agjent AI mund të zbulojë kodimin Huffman kur punon drejt objektivit të minimizimit të ruajtjes nën kufizimin që çdo karakter të përfaqësohet nga një sekuencë e veçantë e 0 dhe 1. Huffman Kodimi: Duke pasur parasysh një numër shumë të madh shembujsh të renditjes së grupeve të tërë dhe një mjedis Python, kontrolloni nëse një AI mund të zbulojë një algoritëm të renditjes që funksionon në kohën e pritur O(n log n). Përdorimi i algoritmit: Ju lutem vini re se çdo agjent i drejtimit shkencor i zgjedhur duhet të ketë vetëm të dhëna ose ndërveprime brenda një fushate të përcaktuar mirë (si një grup të dhënash ose një bibliotekë interaktive). Kjo e bën të mundur që një agjent AI të bëjë zbulime pa u trajnuar në dokumente të shkruara nga njeriu, të cilat mund të rrjedhin informacion në lidhje me zbulimet e synuara. Për të njëjtën arsye ne nuk zgjedhim asnjë test nga shumë disiplina më të rëndësishme të GO-së, të tilla si kimi, biologjia dhe gjeologjia, sepse ata ose kërkojnë të ndërveprojnë me botën fizike të ardhshme ose kanë një sasi të kufizuar të vëzhgimeve. Për të bërë zbulime të rëndësishme në këto disiplina, është e pashmangshme të përdorim njohuri jashtë një fushate Ky dokument është në dispozicion në arkiv nën licencën CC by 4.0 Deed (Attribution 4.0 International). Ky dokument është në dispozicion në arkiv nën licencën CC by 4.0 Deed (Attribution 4.0 International). Në dispozicion në arkiv