De AI Winters y lo que significa para el futuro

Saliendo de nuestra serie sobre la historia de los LLM, hoy queremos contarles la fascinante historia de los "inviernos de IA": períodos de financiación e interés reducidos en la investigación de IA. Verá cómo la emoción y la decepción se alternan, pero la investigación importante siempre persevera. Únase a nosotros mientras exploramos la naturaleza evolutiva de la inteligencia artificial en esta línea de tiempo más completa de los inviernos de IA. (Si no tiene tiempo ahora, ¡asegúrese de guardar el artículo para más tarde! Vale la pena leerlo con algunas lecciones para aprender). Que bueno que es verano porque nos estamos sumergiendo en: Invierno n.º 1, 1966: error de traducción automática Invierno #2, 1969: Conexionistas y Eclipse de la investigación de redes neuronales Invierno #3, 1974: Brecha de comunicación entre los investigadores de IA y sus patrocinadores Invierno n.° 4, 1987: Colapso del mercado de máquinas LISP Invierno n.º 5, 1988: Sin inteligencia artificial de alto nivel, sin dinero Winter#1, 1966: Traducción automática Como se discutió en de esta serie, la investigación de la PNL tiene sus raíces a principios de la década de 1930 y comienza su existencia con el trabajo sobre la traducción automática (TA). Sin embargo, importantes avances y aplicaciones comenzaron a surgir después de la publicación del influyente de Warren Weaver en 1949. la primera edición memorando En los años siguientes, se desarrollaron hechos notables: IBM se embarcó en el desarrollo de la primera máquina, el MIT nombró a su primer profesor de tiempo completo en traducción automática y se llevaron a cabo varias conferencias dedicadas a la TA. La culminación llegó con la demostración pública de la máquina IBM-Georgetown, que atrajo la atención generalizada en periódicos respetados en 1954. El memorándum generó gran entusiasmo en la comunidad investigadora. Otro factor que impulsó el campo de la traducción mecánica fue . Durante ese período, la CIA creía firmemente en la importancia de desarrollar capacidades de traducción automática y apoyó tales iniciativas. También reconocieron que este programa tenía implicaciones que iban más allá de los intereses de la CIA y la comunidad de inteligencia. el interés mostrado por la Agencia Central de Inteligencia (CIA) escépticos Los titulares sobre el experimento IBM-Georgetown proclamaban frases como " ", "La máquina bilingüe", "El cerebro robótico traduce el ruso al inglés del rey" y " ". Sin embargo, la demostración real involucró la traducción de un conjunto seleccionado de solo 49 oraciones rusas al inglés, con . Para poner las cosas en perspectiva, este encontró que los humanos necesitan un vocabulario de alrededor de 8,000 a 9,000 familias de palabras para comprender textos escritos con un 98% de precisión. Al igual que todos los auges de IA que han sido seguidos por inviernos desesperados de IA, los medios tendieron a exagerar la importancia de estos desarrollos. El cerebro electrónico traduce el ruso Creación políglota el vocabulario de la máquina limitado a solo 250 palabras estudio Esta demostración causó sensación. Sin embargo, también hubo escépticos, como el profesor Norbert Wiener, considerado uno de los primeros pioneros en sentar las bases teóricas para la investigación de la IA. Incluso antes de la publicación del memorándum de Weaver y ciertamente antes de la manifestación, Wiener expresó sus dudas en a Weaver en 1947, afirmando: una carta Francamente, me temo que los límites de las palabras en diferentes idiomas son demasiado vagos y las connotaciones emocionales e internacionales son demasiado extensas para hacer que cualquier esquema de traducción casi mecánico sea muy esperanzador. [...] En el momento actual, la mecanización del lenguaje, más allá de una etapa como el diseño de oportunidades de lectura fotoeléctrica para ciegos, parece muy prematura. Partidarios y la financiación de MT Sin embargo, parece que los escépticos eran una minoría, ya que los soñadores eclipsaron sus preocupaciones y aseguraron con éxito la financiación necesaria. Cinco agencias gubernamentales desempeñaron un papel en el patrocinio de la investigación: la Fundación Nacional de Ciencias (NSF) fue el principal contribuyente, junto con la Agencia Central de Inteligencia (CIA), el Ejército, la Armada y la Fuerza Aérea. Para 1960, estas organizaciones habían invertido colectivamente casi $5 millones en proyectos relacionados con la traducción mecánica. En 1954, la investigación de la traducción mecánica había ganado suficiente interés como para recibir el reconocimiento de la Fundación Nacional de Ciencias (NSF), que otorgó una subvención al Instituto Tecnológico de Massachusetts (MIT). La CIA y la NSF entablaron negociaciones, lo que resultó en correspondencia entre los dos directores a principios de 1956. La NSF acordó administrar cualquier programa de investigación deseable en traducción automática que fuera acordado por todas las partes involucradas. Según el testimonio de la Fundación Nacional de Ciencias en 1960, 11 grupos en los Estados Unidos estaban involucrados en varios aspectos de la investigación de traducción mecánica apoyados por el Gobierno Federal. También hubo un gran interés por parte de la Fuerza Aérea, el Ejército de los EE. UU. y la Marina de los EE. UU. inicio de la IA El año siguiente a la demostración pública de la máquina IBM-Georgetown, McCarthy acuñó el término "IA" en la para la Conferencia de Verano de Dartmouth, publicada en 1955. propuesta Este evento provocó una nueva ola de sueños y esperanzas, reforzando aún más la existente. entusiasmo. Surgieron nuevos centros de investigación, equipados con potencia informática mejorada y mayor capacidad de memoria. Simultáneamente, tuvo lugar el desarrollo de lenguajes de programación de alto nivel. Estos avances fueron posibles, en parte, gracias a importantes inversiones del Departamento de Defensa, un importante partidario de la investigación de la PNL. Los avances en lingüística, particularmente en el campo de los modelos de gramática formal propuestos por Chomsky, inspiraron varios proyectos de traducción. Estos desarrollos parecían prometer capacidades de traducción significativamente mejoradas. Como escribe John Hutchins en " ", hubo numerosas predicciones de "avances" inminentes. La historia de la traducción automática en pocas palabras Sin embargo, los investigadores pronto encontraron "barreras semánticas" que presentaban desafíos complejos sin soluciones sencillas, lo que llevó a una creciente sensación de desilusión. Desilusión En " ", John Hutchins cita un ejemplo muy usado, la historia de un sistema MT se menciona. Si bien la precisión de esta anécdota es cuestionable, e Isidore Pinchuk incluso dice que la historia puede ser apócrifa, Elaine Rich la usó para mostrar la incapacidad de los primeros sistemas de traducción automática para lidiar con modismos. En general, este ejemplo ilustra los problemas de los sistemas MT relacionados con la semántica de las palabras. El whisky era invisible que convierte el dicho bíblico "El espíritu está dispuesto, pero la carne es débil" al ruso, que luego se tradujo de nuevo como “El whisky es fuerte, pero la carne está podrida”, Dicho bíblico "El espíritu está dispuesto, pero la carne es débil" Traducido por el sistema MT como "El whisky es fuerte, pero la carne está podrida" El principal éxito provino de los del grupo ALPAC, encargado por el gobierno de los Estados Unidos y encabezado por el Dr. Leland Haworth, Director de la Fundación Nacional de Ciencias, que respalda la idea subyacente que se ilustra. En su informe, la traducción automática se compara con la traducción humana de los diversos textos de física y ciencias de la tierra. hallazgos La conclusión: los resultados de la traducción automática fueron menos precisos, más lentos, más costosos y menos completos que la traducción humana en todos los ejemplos revisados. Después del uso exitoso de computadoras para descifrar códigos secretos alemanes en Inglaterra, los científicos creyeron erróneamente que traducir texto escrito entre idiomas no sería más desafiante que decodificar códigos cifrados. Sin embargo, las complejidades del procesamiento del "lenguaje natural" resultaron mucho más formidables de lo previsto. Los intentos de automatizar la búsqueda en el diccionario y aplicar reglas gramaticales arrojaron resultados absurdos. Después de dos décadas y veinte millones de dólares invertidos, no se vislumbraba ninguna solución, lo que llevó al comité del Consejo Nacional de Investigación a terminar el esfuerzo de investigación. En 1966, el Consejo Nacional de Investigación suspendió abruptamente todo apoyo a la investigación de traducción automática en los Estados Unidos. La desilusión surgió debido a las altas expectativas de aplicaciones prácticas en el campo, a pesar de la falta de suficientes fundamentos teóricos en lingüística. Los investigadores se centraron más en los aspectos teóricos que en las implementaciones prácticas. Además, la disponibilidad limitada de hardware y la inmadurez de las soluciones tecnológicas plantearon desafíos adicionales. Invierno #2, 1969: Conexionistas y Eclipse de la investigación de redes neuronales La segunda ola de decepción llegó rápidamente después de la primera, sirviendo como advertencia para los investigadores de IA sobre los peligros de las afirmaciones exageradas. Sin embargo, antes de profundizar en los problemas que siguieron, es necesaria cierta información de fondo. En la década de 1940, McCulloch y Walter Pitts se embarcaron en la comprensión de los principios fundamentales de la mente y las primeras versiones de las redes neuronales artificiales, inspirándose en la estructura de las redes neuronales biológicas. desarrollaron Alrededor de una década después, en la década de 1950, la ciencia cognitiva surgió como una disciplina distinta, conocida como la "revolución cognitiva". Muchos de los primeros modelos de IA se vieron influenciados por el funcionamiento del cerebro humano. Un ejemplo notable es el sistema SNARC de Marvin Minsky, la primera red neuronal artificial computarizada que simulaba una rata navegando por un laberinto. El éxito de programas como (1956), considerado el primer programa de IA, y (1957), diseñado como una máquina universal de resolución de problemas por Allen Newell, Herbert A. Simon y Cliff Shaw de Rand Corporation, desempeñó un papel en este cambio. Sin embargo, a fines de la década de 1950, estos enfoques se abandonaron en gran medida cuando los investigadores dirigieron su atención al razonamiento simbólico como la clave de la inteligencia. Logic Theorist General Problem Solver Continuó un tipo de trabajo conexionista: persistió el estudio de los perceptrones, defendido por Frank Rosenblatt con entusiasmo inquebrantable. Rosenblatt inicialmente simuló perceptrones en una computadora IBM 704 en el Laboratorio Aeronáutico de Cornell en 1957. Sin embargo, esta línea de investigación se detuvo abruptamente en 1969 con la publicación del libro de Marvin Minsky y Seymour Papert, que delineó las limitaciones percibidas de los perceptrones. Perceptrons Como Daniel Crevier: escribió Poco después de la aparición de los perceptrones, un evento trágico ralentizó aún más la investigación en el campo: Frank Rosenblatt, para entonces un hombre destrozado según los rumores, se ahogó en un accidente de navegación. Habiendo perdido a su promotor más convincente, la investigación de redes neuronales entró en un eclipse que duró quince años. Durante este tiempo, todavía se estaban logrando avances significativos en la investigación conexionista, aunque en menor escala. La introducción de de Paul Werbos en 1974, un algoritmo crucial para entrenar redes neuronales, continuó progresando, aunque con recursos limitados. la retropropagación Asegurar una financiación importante para proyectos conexionistas siguió siendo un desafío, lo que llevó a un declive en su búsqueda. El invierno llegó a su fin cuando notables investigadores como John Hopfield, David Rumelhart y otros revivieron un interés renovado y generalizado en las redes neuronales. Su trabajo reavivó el entusiasmo por los enfoques conexionistas y allanó el camino para el resurgimiento de la investigación y el desarrollo a gran escala en el campo de las redes neuronales. No fue hasta mediados de la década de 1980 cuando se produjo un punto de inflexión. Invierno #3, 1974: Brecha de comunicación entre los investigadores de IA y sus patrocinadores A fines de la década de 1960 y principios de la de 1970, Minsky y Papert dirigieron el en el MIT, donde desarrollaron modelos simplificados llamados micromundos. Ellos definieron el impulso general del esfuerzo como: Las altas expectativas y las pretensiones ambiciosas suelen ser un camino directo a la decepción. proyecto Micro Worlds Creemos que [los micromundos] son tan importantes que estamos dedicando una gran parte de nuestro esfuerzo a desarrollar una colección de estos micromundos y encontrar cómo usar los poderes sugerentes y predictivos de los modelos sin ser abrumados por su incompatibilidad con el verdad literal. Pronto, los defensores de los micromundos se dieron cuenta de que incluso los aspectos más específicos del uso humano no podían definirse sin considerar el contexto más amplio de la cultura humana. Por ejemplo, las técnicas utilizadas en SHRDLU se limitaron a dominios específicos de experiencia. Minsky, Papert y sus estudiantes no pudieron generalizar progresivamente un micromundo en un universo más grande o simplemente combinar varios micromundos en un conjunto más grande. El enfoque de los micromundos no condujo a una solución gradual para la inteligencia general. El proyecto del robot Shakey en Stanford, por ejemplo, no cumplió con las expectativas de convertirse en un dispositivo de espionaje automatizado. Los investigadores se vieron atrapados en un ciclo de creciente exageración, en el que prometían más de lo que podían cumplir en sus propuestas. Los resultados finales a menudo se quedaron cortos y estaban lejos de las promesas iniciales. Se enfrentaron dificultades similares para cumplir con las expectativas en otros laboratorios de IA en todo el país. DARPA, la agencia del Departamento de Defensa que financia muchos de estos proyectos, comenzó a reevaluar su enfoque y exigió expectativas más realistas de los investigadores. 1971-1975: recortes de DARPA A principios de la década de 1970, el programa Speech Understanding Research (SUR) de DARPA tenía como objetivo desarrollar sistemas informáticos capaces de comprender comandos verbales y datos para la interacción sin intervención en escenarios de combate. Instituciones prominentes como Stanford, MIT y Carnegie Mellon vieron sus contratos multimillonarios reducidos a casi insignificancia. Después de cinco años y un gasto de quince millones de dólares, DARPA canceló abruptamente el proyecto, aunque las razones exactas siguen sin estar claras. Daniel Crevier escribe en su sobre la filosofía de financiación de DARPA en ese momento: libro La filosofía de DARPA entonces era "¡Financiar personas, no proyectos!" Minsky había sido alumno de Licklider en Harvard y lo conocía bien. Como me dijo Minsky, "Licklider nos dio el dinero de una sola vez", y no se preocupó particularmente por los detalles. Varios contratistas de renombre, incluidos Bolt, Beranek y Newman, Inc. (BBN) y Carnegie Mellon, produjeron sistemas notables durante esos cinco años. Estos sistemas incluyeron SPEECHLESS, HIM, HEARSAY-I, DRAGON, HARPY y HEARSAY-II, que lograron avances significativos en la comprensión del habla conectada y el procesamiento de oraciones de múltiples hablantes con un vocabulario de mil palabras. , lo que dejaba a los usuarios adivinar qué comandos se les aplicaban debido a la gramática restringida. Por ejemplo, HEARSAY-II, conocido por integrar múltiples fuentes de conocimiento utilizando un dispositivo de "pizarra", fue aclamado como uno de los programas de IA más influyentes jamás escritos. Estos sistemas tenían limitaciones para comprender la entrada sin restricciones A pesar de la decepción en este aspecto, los investigadores de IA consideraron estos proyectos con orgullo. Pero en este punto, la brecha de comunicación entre los investigadores de IA y sus patrocinadores sobre las expectativas se volvió demasiado grande. 1973: gran disminución en la investigación de IA en el Reino Unido en respuesta al informe Lighthill La marea menguante de la investigación de la IA no fue exclusiva de los investigadores estadounidenses. En Inglaterra, un de Sir James Lighthill, una figura distinguida en dinámica de fluidos y ex ocupante de la Cátedra Lucasiana de Matemáticas Aplicadas de la Universidad de Cambridge, Lighthill clasificó su investigación en tres partes, denominadas "El ABC del tema". informe asestó un golpe devastador al estado de la investigación en IA. "A" representaba la automatización avanzada, con el objetivo de reemplazar a los humanos con máquinas especialmente diseñadas. "C" denota investigación del sistema nervioso central (SNC) basada en computadora. Finalmente, "B" simboliza la inteligencia artificial en sí misma, sirviendo como puente entre las categorías A y C. Si bien las categorías A y C experimentaron períodos alternos de éxito y fracaso, Lighthill enfatizó el sentido generalizado y profundo de desánimo que rodeaba a la Actividad Puente prevista de la categoría B. Como él dice: “ ” Esto plantea dudas sobre si el concepto completo de IA como un campo integrado de investigación es válida. El informe provocó un que se transmitió en la serie "Controversia" de la BBC en 1973. Titulado "El robot de propósito general es un espejismo", el debate tuvo lugar en la Royal Institution, con Sir James Lighthill enfrentándose a Donald Michie, John McCarthy y Richard Gregory. acalorado debate Desafortunadamente, las repercusiones del informe fueron graves y llevaron al desmantelamiento completo de la investigación de IA en Inglaterra. Solo un puñado de universidades, a saber, Edimburgo, Essex y Sussex, continuaron con sus esfuerzos de investigación de IA. No fue hasta 1983 que la investigación en IA experimentó un resurgimiento a mayor escala. Este resurgimiento fue impulsado por la iniciativa de financiación del gobierno británico llamada Alvey, que en respuesta al Proyecto Japonés de Quinta Generación. asignó 350 millones de libras esterlinas a la investigación de IA Invierno n.° 4, 1987: Colapso del mercado de máquinas LISP Durante el período conocido como el invierno conexionista, los sistemas simbólicos como el teórico lógico (1956) y el solucionador general de problemas (1957) continuaron progresando mientras enfrentaban limitaciones de hardware. Estos sistemas solo podían manejar ejemplos de juguetes debido a las capacidades informáticas limitadas en ese momento. Esto es lo que dijo Herbert Simon sobre la situación en las décadas de 1950 y 1960: La gente se alejaba de las tareas que hacían del conocimiento el centro de las cosas porque no podíamos construir grandes bases de datos con las computadoras que teníamos entonces. Nuestro primer programa de ajedrez y el Teórico Lógico se hicieron en una computadora que tenía un núcleo de 64 a 100 palabras y un tambor de scratch con 10,000 palabras de espacio utilizable. Así que la semántica no era el nombre del juego. Recuerdo a un estudiante que tuve que quería hacer una tesis sobre cómo se extraía información de una gran tienda. Le dije “¡De ninguna manera! Solo puede hacer esa tesis en un ejemplo de juguete, y no tendremos ninguna evidencia de cómo se amplía. Será mejor que busques otra cosa que hacer. De modo que la gente se alejó de los problemas en los que el conocimiento era la cuestión esencial. Alrededor de 1960, McCarthy y Minsky en el MIT desarrollaron , un lenguaje de programación basado en funciones recursivas. LISP se volvió tan importante debido a sus habilidades de procesamiento simbólico y flexibilidad en la gestión de tareas complejas, lo cual es crucial para el desarrollo temprano de la IA. Fue uno de los primeros lenguajes utilizados en la investigación de IA. Sin embargo, no fue hasta principios de la década de 1970, con la llegada de las computadoras con capacidades de memoria significativas, que los programadores pudieron implementar aplicaciones intensivas en conocimiento. LISP Estos sistemas formaron la base de los "sistemas expertos", cuyo objetivo era incorporar la experiencia humana y reemplazar a los humanos en ciertas tareas. LISP "fue una desviación radical de los lenguajes existentes" e introdujo nueve ideas innovadoras, según el de Paul Graham, programador de computadoras y cofundador de Y Combinator y Hacker News. La década de 1980 marcó el surgimiento de los sistemas expertos, transformando la IA de un campo académico a aplicaciones prácticas, y LISP se convirtió en el lenguaje de programación preferido para eso. ensayo El desarrollo de sistemas expertos representó un hito significativo en el campo de la IA, cerrando la brecha entre la investigación académica y las aplicaciones prácticas. John McDermott de la Universidad Carnegie Mellon propuso el primer sistema experto llamado XCON (eXpert CONfigurer) en enero de 1980. XCON fue empleado por Digital Equipment Corporation (DEC) para agilizar el proceso de configuración de sus computadoras VAX. Para 1987, XCON procesó una cantidad significativa de pedidos, demostrando su impacto y efectividad. En 1981, CMU comenzó a trabajar en un nuevo sistema llamado Xsel. Posteriormente, DEC se hizo cargo del desarrollo y las pruebas de campo comenzaron en octubre de 1982. Si bien Xcon y Xsel recibieron una publicidad significativa, todavía estaban en la etapa de prototipo. Bruce Macdonald, entonces gerente del programa Xsel, comenzó a protestar porque la publicidad superaba con creces los logros, pero el vicepresidente de ventas no estaba dispuesto a detenerse. De hecho, Macdonald recuerda la reunión con altos ejecutivos en la que el vicepresidente de ventas lo miró y le dijo: “Has estado trabajando en esto durante tres años. ¿No está listo? A principios de la década de 1980 se produjo una afluencia de historias de éxito de sistemas expertos, lo que condujo a la formación de grupos de IA en muchas grandes empresas. El auge de las computadoras personales, la popularidad de las películas de Star Wars y revistas como Discover y High Technology contribuyeron a la fascinación del público por la IA. : El auge de la biotecnología de mil millones de dólares a fines de la década de 1970 impulsó el interés de inversión en alta tecnología, lo que llevó a los principales expertos en inteligencia artificial a embarcarse en nuevas empresas Edward Feigenbaum, a quien a menudo se le llama el "padre de los sistemas expertos", con algunos de sus colegas de Stanford, formaron Teknowledge, Inc. Los investigadores de Carnegie Mellon incorporaron el Grupo Carnegie. Hubo suficientes spin-offs del MIT para crear una tira en Cambridge, Massachusetts, conocida como AI Alley. Estas nuevas empresas incluyeron Symbolics, Lisp Machines, Inc. y Thinking Machines Corporation. El investigador Larry Harris dejó Dartmouth para formar la Corporación de Inteligencia Artificial. Roger Schank, en Yale, supervisó la formación de Cognitive Systems, Inc. Las empresas que aparecieron en ese momento podrían dividirse en tres áreas principales enumeradas desde la que tiene las ventas más grandes hasta la que tiene las ventas más pequeñas: Hardware y software relacionados con la IA, específicamente microcomputadoras llamadas máquinas LISP, dedicadas a ejecutar programas LISP a velocidades cercanas a las de un mainframe Las grandes corporaciones utilizaban software llamado "herramientas de desarrollo de sistemas expertos" o "shells" para desarrollar sus sistemas expertos internos. Aplicaciones reales de sistemas expertos . En 1986, las ventas estadounidenses de hardware y software relacionados con la IA alcanzaron los 425 millones de dólares, con la formación de 40 nuevas empresas y una inversión total de 300 millones de dólares. En 1985, 150 empresas gastaron colectivamente mil millones de dólares en grupos internos de IA El crecimiento explosivo trajo desafíos a medida que la academia se sintió abarrotada por la afluencia de reporteros, capitalistas de riesgo, cazatalentos de la industria y empresarios. La reunión inaugural de la Asociación Estadounidense de Inteligencia Artificial en 1980 atrajo a alrededor , mientras que en 1985, una reunión conjunta de AAAI e IJCAI tuvo una asistencia . El ambiente cambió de vestimenta informal a vestimenta formal. de mil investigadores cercana a los seis mil En 1984, en la reunión anual de AAAI, Roger Schank y Marvin Minsky advirtieron sobre el próximo . "Invierno de IA", prediciendo un estallido inminente de la burbuja de IA, que sucedió tres años después, y el mercado de IA especializada basada en LISP. el hardware colapsó Sun Microsystems y empresas como Lucid ofrecieron potentes estaciones de trabajo y entornos LISP como alternativas. Las estaciones de trabajo de uso general plantearon desafíos para LISP Machines, lo que llevó a empresas como Lucid y Franz LISP a desarrollar versiones y portátiles de LISP para sistemas UNIX. Más tarde, surgieron computadoras de escritorio de Apple e IBM con arquitecturas más simples para ejecutar aplicaciones LISP. En 1987, estas alternativas igualaron el rendimiento de las costosas máquinas LISP, lo que hizo que las máquinas especializadas quedaran obsoletas. cada vez más potentes La industria de 500 millones de dólares fue reemplazada rápidamente en un solo año. La década de 1990: resistencia al despliegue y mantenimiento de nuevos sistemas expertos Después del colapso del mercado de máquinas LISP, las máquinas más avanzadas ocuparon su lugar, pero finalmente corrieron la misma suerte. A principios de la década de 1990, la mayoría de las empresas comerciales de LISP, incluidas Symbolics y Lucid Inc., habían quebrado. Texas Instruments y Xerox también se retiraron del campo. Algunas empresas clientes continuaron manteniendo los sistemas basados en LISP, pero esto requería trabajo de soporte. En la década de 1990 y más allá, el término "sistema experto" y el concepto de sistemas de IA autónomos desaparecieron en gran medida del léxico de TI. Hay dos interpretaciones de esto. Una opinión es que "los sistemas expertos fallaron" porque no pudieron cumplir con su promesa exagerada, lo que llevó al mundo de TI a seguir adelante. La otra perspectiva es que los sistemas expertos fueron víctimas de su éxito. A medida que los profesionales de TI adoptaron conceptos como motores de reglas, estas herramientas pasaron de ser herramientas independientes para desarrollar sistemas expertos especializados a convertirse en herramientas estándar entre muchas. Invierno n.º 5, 1988: Sin inteligencia artificial de alto nivel, sin dinero En 1981, los japoneses dieron a conocer su ambicioso plan para el proyecto de computadora de quinta generación, lo que generó preocupación en todo el mundo. Estados Unidos, con su historial de financiamiento del Departamento de Defensa para la investigación y la experiencia técnica de la IA, respondió con el lanzamiento de la Iniciativa de Computación Estratégica (SCI) en 1983. La SCI tenía como objetivo desarrollar hardware informático avanzado e IA en un plazo de diez años. Los autores de describen “la máquina imaginada por SCI”: Strate gic Computing: DARPA and the Quest for Machine Intelligence, 1983-1993 Ejecutaría diez mil millones de instrucciones por segundo para ver, oír, hablar y pensar como un ser humano. El grado de integración requerido rivalizaría con el logrado por el cerebro humano, el instrumento más complejo conocido por el hombre. Un proyecto notable bajo la Iniciativa de Computación Estratégica (SCI) fue el proyecto "Smart Truck" o . Recibió una parte significativa del presupuesto anual de SCI y tenía como objetivo desarrollar un robot versátil para varias misiones. Estas misiones incluyeron entrega de armas, reconocimiento, manejo de municiones y reabastecimiento en la retaguardia. El objetivo era crear un vehículo que pudiera navegar por terreno accidentado, superar obstáculos y utilizar camuflaje. Inicialmente, los prototipos con ruedas se limitaban a carreteras y terrenos llanos, pero el producto final se concibió para atravesar cualquier terreno sobre patas mecánicas. Vehículo Terrestre Autónomo (ALV) A fines de la década de 1980, se hizo evidente que el proyecto no estaba cerca de alcanzar los niveles deseados de inteligencia artificial. El desafío principal surgió de la falta de una estructura de gestión eficaz y estable que pudiera coordinar diferentes aspectos del programa y avanzarlos colectivamente hacia la meta de la inteligencia artificial. Se hicieron varios intentos para imponer esquemas de manejo en SCI, pero ninguno resultó exitoso. Además, los ambiciosos objetivos de SCI, como la capacidad de conducción autónoma del proyecto ALV, excedieron lo que se podía lograr en ese momento y se asemejaron a los sistemas de IA multimodal contemporáneos y al elusivo concepto de AGI (inteligencia general artificial). Bajo el liderazgo de Jack Schwarz, quien asumió el control de la Oficina de Tecnología de Procesamiento de la Información (IPTO) . En , Pamela McCorduck describe la actitud de Schwarz hacia la Iniciativa de Computación Estratégica y el papel de la IA: en 1987, se redujo la financiación para la investigación de IA dentro de DARPA Machines Who Think: A Personal Inquiry into the History and Prospects of Artificial Intelligence Schwartz creía que DARPA estaba usando un modelo de natación: establecer una meta y remar hacia ella independientemente de las corrientes o las tormentas. En cambio, DARPA debería usar un modelo de surfista: esperar la gran ola, lo que permitiría que sus fondos relativamente modestos surfearan con gracia y éxito hacia ese mismo objetivo. A la larga, la IA era posible y prometedora, pero su ola aún no se había elevado. A pesar de no alcanzar la inteligencia artificial de alto nivel, el SCI logró hitos técnicos específicos. Por ejemplo, en 1987, el ALV había demostrado capacidades de conducción autónoma en carreteras de dos carriles, evitación de obstáculos y conducción todoterreno en diferentes condiciones. El uso de cámaras de video, escáneres láser y unidades de navegación inercial iniciadas por el programa SCI ALV sentó las bases para los desarrollos comerciales de automóviles sin conductor de la actualidad. en el SCI entre 1983 y 1993, como se dijo en . El proyecto finalmente fue reemplazado por la Iniciativa de Computación Estratégica Acelerada en la década de 1990 y más tarde por el Programa de Computación y Simulación Avanzada. El Departamento de Defensa invirtió $1,000,417,775.68 Informática Estratégica: DARPA y la Búsqueda de Inteligencia Artificial, 1983-1993 Conclusión ¡Frío! Seguramente los inviernos de IA no eran divertidos. Pero parte de la investigación que hizo posible los avances recientes con modelos de lenguaje grandes (LLM) se realizó durante esos tiempos. Durante el apogeo de los sistemas expertos simbólicos, los investigadores conexionistas continuaron su trabajo en redes neuronales, aunque en menor escala. El descubrimiento de Paul Werbos de la retropropagación, un algoritmo crucial para el entrenamiento de redes neuronales, fue fundamental para seguir avanzando. A mediados de la década de 1980, el "invierno conexionista" llegó a su fin cuando investigadores como Hopfield, Rumelhart, Williams, Hinton y otros demostraron la eficacia de la retropropagación en las redes neuronales y su capacidad para representar distribuciones complejas. Este resurgimiento se produjo simultáneamente con el declive de los sistemas expertos simbólicos. Después de este período, la investigación sobre redes neuronales floreció sin más contratiempos, lo que condujo al desarrollo de numerosos modelos nuevos, lo que eventualmente allanó el camino para el surgimiento de los LLM modernos. En la próxima edición, profundizaremos en este fructífero período de investigación de redes neuronales. ¡Manténganse al tanto! Historia de LLM por Turing Post: La era de la traducción mecánica y cómo se estrelló Fascinante nacimiento de la IA, los primeros chatbots y el poder del Departamento de Defensa de EE. UU. La historia de AI Winters y lo que nos enseña hoy Continuará… Esta historia fue en Turing Post. Si te gustó este número, para recibir el cuarto episodio de la Historia de los LLM directamente en tu bandeja de entrada. publicada originalmente suscríbete