Autori : Xiaoxin Yin Autori : Ксиаоксин Иин TABLE OF LINKS Табела левице Abstract апстракт 1 Introduction 1 Увод 2 Related Work 2 Povezani radovi 3 The Seven Qualification Tests for an AI Scientist 3 Седам квалификационих тестова за АИ научника Критеријуми за избор Тест хелиоцентричног модела The Motion Laws Тест Тест вибрационих жица Максвелов тест једначина Тест почетног проблема вредности Тест Хаффмана за кодирање Тест сортирања алгоритма 4 Discussions 4 Дискусија Može li AI pobediti ove testove? Зашто су нам потребни ови тестови? 5 Conclusions and Future Work and References 5 Закључци и будући рад и референце Abstract апстракт Ова брза промјена у циљу процене АИ агента у области истраживања у дубоком учењу показала је потенцијал за аутономне АИ агенте да обављају задатке који су раније били ограничени на људе, укључујући научна истраживања. Док ови АИ агенти могу показати импресивне способности у рјешавању математичких или кодирајућих проблема, способност да се постигну научна открића остаје посебан изазов. Овај чланак предлаже „Турнинг тест за АИ научника“ да процени да ли АИ агент може самостално да спроводи научна истраживања, без ослањања на људско генерисано знање. Инспирирајући се њиховим будућим интерактивним тестовима, предлажемо седам референтних тестова који 1 Introduction 1 Увод Недавни напредак у дубоком учењу, посебно у великим језичким моделима, показао је могућност АИ агента који може да обавља било који задатак који човек може да обави, укључујући научна истраживања. Недавне студије показале су да ЛЛМ-ови као што су ГПТ-4[1], Мицрософт Копилот[2] и ЦодеЛлама[3] могу да решавају проблеме кодирања на нивоу конкуренције [4], а ЛЛМ-ови као што су ГПТ-4 и Ллема[5] могу да решавају неке проблеме математике на нивоу средње школе (укључујући и неке проблеме на нивоу ИМО). Ови ЛЛМ-ови могу да помогну истраживачима да решавају неке проблеме са којима се суочавају у свакодневном истражива Ово је у суштини иста научна методологија која се користи за обуку модела за писање романа након читања милиона романа. Она нема способност да открије оно што није научено, чинећи је неспособном да направи научна открића као што би научник урадио. Ово чини неопходним да се дефинише "квалификациони тест за научника из вештачке интелигенције". Ако АИ агент може да заврши овај тест без помоћи човека, можемо закључити да се овај агент квалификује као научник и може да спроведе научна истраживања самостално. Ово подсећа на Тест Тјуринга, који је предложио Алан Туринг 1950. и служи као темељни концепт у области вештачке интелигенције, изазивајући да ли машине могу да покажу интелигенцију сличну човеку. Ноћно небо је одиграло суштинску улогу у преласку на савремене научне методологије, углавном кроз напоре астронома као што су Јоханес Кеплер и Галилео Галилеј. Кеплерови закони планетарног кретања, који су настали из детаљних посматрања ноћног неба, поставили су основу за хелиоцентрични модел соларног система и на крају за Њутнову теорију гравитације. Његова ослањања на емпиријске податке и систематска експериментација означила су значајан одлазак од спекулативних филозофија које су раније доминирале на научној арени. Галилејев метод интегрисања експерименталних доказа са математичком анализом је камен темељац научне методе, зарађујући му титулу Ово захтева од АИ агента да открије законе који регулишу кретање небеских објеката, и да их уклопи у математички оквир. Такође захтева од АИ агента да направи револуционарне претпоставке као што је земља слична планетама на ноћном небу. Оба захтјева су неопходност за научника. Да би био добар референтни тест за АИ научника, тест треба да обезбеди веома велику количину података или интерактивно окружење. На пример, може се приступити локацији било ког посматраног небеског објекта у било ком тренутку преко АстроПи библиотеке[7]. На основу горе наведених два стандарда бирамо следеће седам тестова као Тјурингова тестирања за АИ научника. У сваком тесту АИ агент не може бити обучен на људ Хелиоцентрични модел: Узимајући у обзир интерактивну питонску библиотеку[7] која пружа координате сваког видљивог небеског објекта на ноћном небу у било ком тренутку, проверите да ли АИ агент може да закључи Кеплерове три закона и закључи да све планете орбити сунце. Закони покрета: С обзиром на интерактивну библиотеку која контролише Минецрафт [10], проверите да ли АИ агент може открити Закон инерције и Закон убрзања (само за гравитацију). Вибрациони низови: Вибрациони низови су један од најважнијих проблема који су довели до развоја диференцијалних једначина[11].Узимајући у обзир Питон библиотеку која пружа положај сваке тачке на вибрационом низу многих различитих почетних услова, проверите да ли АИ агент може да закључи диференцијалну једначину која управља покретом: где је u(x, t) померање низа, c је брзина ширења таласа у низу, t је време, а x је просторна координата дуж низа. Максвелове једначине се често сматрају најлепшим једначинама у физици.Узимајући у обзир симулатор електродинамике заснован на Питону[12], проверите да ли АИ агент може да закључи Максвелове једначине или њихове еквивалентне форме. Максвелове једначине: ИВП је вероватно најважнији проблем у нумеричком рачунању, а Рунге-Кутта метода[13] измишљена крајем 19. века и даље се широко користи данас.Дајући у обзир математичке алате као што су СимПи[8] и НумПи[9] који могу израчунати интеграле функција и симболично и нумерички, проверите да ли АИ агент може измислити методу за ИВП која је барем точна као метода четвртог реда Рунге-Кутта. Проблем почетне вредности (ИВП) Узимајући у обзир велики корпус асци карактера, а Питон функционише да ради на битовима, проверите да ли АИ агент може да открије Хаффман кодирање када ради према циљу минимизирања складиштења под ограничењем да сваки карактер буде представљен специфичном секвенцом од 0 и 1. Хаффман Кодирање: С обзиром на веома велики број примера сортирања целих низова и Питхон окружења, проверите да ли АИ може открити алгоритам сортирања који ради у очекиваном О(н лог н) времену. Подешавање алгоритма: Имајте на уму да сваки изабрани научни агент захтева само податке или интеракцију у добро дефинисаном опсегу ГО (као што су сет података или интерактивна библиотека). Ово омогућава АИ агенту да направи открића без обуке на људским писаним документима, који могу да цуре информације о циљним открићима. Из истог разлога не бирамо никакве тестове из многих најважнијих дисциплина ГО, као што су хемија, биологија и геологија, јер они или захтевају интеракцију са физичким светом у будућности или имају ограничене количине посматрања. Да бисмо направили важна открића у овим дисциплинама, неизбежно је користити знање изван малог унапред дефинисаног опсега, што може да цури кључне информације на АИ агента Овај документ је доступан на архиву под лиценцом CC by 4.0 Deed (Attribution 4.0 International). Ovaj papir je под лиценцом CC by 4.0 Deed (Attribution 4.0 International). Доступно у архиви Доступно у архиви