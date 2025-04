Autorët: (1) Raphaël Millière, Departamenti i Filozofisë, Universiteti Macquarie ([email protected]); (2) Cameron Buckner, Departamenti i Filozofisë, Universiteti i Hjustonit ([email protected]).

Rrjetet nervore artificiale, duke përfshirë arkitekturat e mëparshme NLP, kanë qenë prej kohësh fokusi i kërkimit filozofik, veçanërisht midis filozofëve të mendjes, gjuhës dhe shkencës. Pjesa më e madhe e diskutimit filozofik rreth këtyre sistemeve sillet rreth përshtatshmërisë së tyre për të modeluar njohjen njerëzore. Në mënyrë të veçantë, debati përqendrohet nëse ato përbëjnë modele më të mira të proceseve thelbësore njohëse njerëzore sesa homologët e tyre klasikë, simbolikë, të bazuar në rregulla. Këtu, ne shqyrtojmë pyetjet kryesore filozofike që janë shfaqur në lidhje me rolin e rrjeteve nervore artificiale si modele të inteligjencës, racionalitetit ose njohjes, duke u fokusuar në mishërimet e tyre aktuale në kontekstin e diskutimeve të vazhdueshme rreth implikimeve të LLM-ve të bazuara në transformator.





Debatet e fundit janë turbulluar nga një model konkluzioni mashtrues, të cilin ne e quajmë "Gabimi i ripërshkrimit". Ky gabim lind kur kritikët argumentojnë se një sistem nuk mund të modelojë një të veçantë









kapaciteti njohës, thjesht sepse operacionet e tij mund të shpjegohen në terma më pak abstrakte dhe më deflacioniste. Në kontekstin aktual, gabimi shfaqet në pretendimet se LLM-të nuk mund të jenë modele të mira të disa kapaciteteve njohëse sepse operacionet e tyre konsistojnë thjesht në një koleksion llogaritjesh statistikore, ose operacione algjebër lineare, ose parashikime të tjera. Argumente të tilla janë të vlefshme vetëm nëse shoqërohen me prova që tregojnë se një sistem, i përcaktuar në këto terma, është në thelb i paaftë për t'u zbatuar. Për ta ilustruar, merrni parasysh logjikën e gabuar në pohimin se një piano nuk mund të prodhojë harmoni sepse mund të përshkruhet si një koleksion çekiçësh që godasin telat, ose (më saktë) se aktiviteti i trurit nuk mund të zbatojë njohjen sepse mund të përshkruhet si një koleksion i goditjeve nervore. Pyetja kritike nuk është nëse operacionet e një LLM mund të përshkruhen në mënyrë të thjeshtuar në terma jo mendorë, por nëse këto operacione, kur organizohen siç duhet, mund të zbatojnë të njëjtat procese ose algoritme si mendja, kur përshkruhen në një nivel të përshtatshëm abstraksioni llogaritës.





Gabimi i ripërshkrimit është një simptomë e një tendence më të gjerë për të trajtuar pyetjet kryesore filozofike në lidhje me rrjetet nervore artificiale si thjesht teorike, duke çuar në pretendime gjithëpërfshirëse në parim që nuk janë të përshtatshme për moskonfirmim empirik. Hipotezat këtu duhet të udhëhiqen nga dëshmi empirike në lidhje me kapacitetet e rrjeteve nervore artificiale si LLM-të dhe përshtatshmërinë e tyre si modele njohëse (shih tabelën 1). Në fakt, konsideratat rreth arkitekturës, objektivit të të mësuarit, madhësisë së modelit dhe të dhënave të trajnimit të LLM-ve janë shpesh të pamjaftueshme për të arbitruar këto çështje. Në të vërtetë, pohimi ynë është se shumë nga debatet thelbësore filozofike mbi kapacitetet e rrjeteve nervore në përgjithësi, dhe LLM-ve në veçanti, varen të paktën pjesërisht nga provat empirike në lidhje me mekanizmat e tyre të brendshëm dhe njohuritë që ata fitojnë gjatë kursit të trajnimit. Me fjalë të tjera, shumë nga këto debate nuk mund të zgjidhen a priori duke marrë parasysh karakteristikat e përgjithshme të modeleve të patrajnuara. Përkundrazi, ne duhet të marrim parasysh gjetjet eksperimentale në lidhje me sjelljen dhe funksionimin e brendshëm të modeleve të trajnuar.





Në këtë pjesë, ne shqyrtojmë debatet e gjata në lidhje me kapacitetet e rrjeteve nervore artificiale që janë ringjallur dhe transformuar nga zhvillimi i të mësuarit të thellë dhe suksesi i fundit i LLM-ve në veçanti. Provat e sjelljes të marra nga standardet dhe eksperimentet e synuara kanë një rëndësi të madhe për ato debate. Megjithatë, vërejmë që në fillim se një provë e tillë është gjithashtu e pamjaftueshme për të paraqitur tablonë e plotë; Duke u lidhur me shqetësimet në lidhje me Blockhead-et e shqyrtuara në seksionin e parë, ne duhet të shqyrtojmë gjithashtu provat se si LLM-të e përpunojnë informacionin nga brenda për të mbyllur hendekun midis pretendimeve në lidhje me performancën e tyre dhe kompetencës së supozuar. Janë zhvilluar metoda eksperimentale të sofistikuara për të identifikuar dhe ndërhyrë në paraqitjet dhe llogaritjet e marra nga LLM të trajnuar. Këto metoda premtojnë shumë për të arbitruar disa nga çështjet filozofike të shqyrtuara këtu përtej hipotezave tentative të mbështetura nga prova të sjelljes. Ne lëmë një diskutim më të detajuar të këtyre metodave dhe gjetjeve eksperimentale përkatëse në Pjesën II.





