Recientemente, participé en un debate de mesa redonda sobre temas de IA en la Universidad de Oxford, unido por académicos y profesionales de IA y cumplimiento. Uno de los participantes comenzó a hablar sobre la aterradora “singularidad de IA”. Me hizo pensar mucho sobre la intersección entre los dos dominios. empecé a jugar con la idea de encontrar correlaciones entre la IA y la física. La singularidad Los agujeros negros tecnológicos: la singularidad de la IA En física, una singularidad es una región donde la curvatura del espacio-tiempo se vuelve infinita. El concepto está famoso por estar ligado a agujeros negros, donde la materia se comprime a densidad infinita y volumen cero, y el tiempo y el espacio realmente se inclinan infinitamente. - Perdonen la simplificación, los físicos (ver A diferencia de los agujeros negros, de los que nada puede escapar una vez que entra en su frontera, los agujeros blancos expulsan la materia y no pueden entrar. El agujero blanco Los agujeros blancos Los agujeros blancos La aplicación de La tecnología como un punto en el que las capacidades tecnológicas se vuelven infinitas e incontrolables no es nada nuevo. : ese hipotético momento en el futuro cuando la IA supera las capacidades cognitivas humanas y se vuelve autónoma en la auto-mejora y escalación. Esto refuerza aún más la idea de que los humanos pueden un día ya no ser capaces de comprender, y por lo tanto controlar, los sistemas de IA. Estas preocupaciones están probablemente explotadas de proporción, hinchadas por la imaginación cinematográfica, y parecen estar restringidas por la realidad de nuestros recursos limitados. en el presente. singularidad La singularidad Imposible lograrlo El horizonte de los modelos de AI Como se mencionó, nada que cruce la frontera de un agujero negro puede escapar.Ni siquiera la luz, que está atrapado para siempre. No es un borde visible, sino más bien una región matemática – una que necesitamos agradecer por el . Evento Horizon Karl Schwarzschild Hay un concepto algo similar en los sistemas de IA, es decir, un horizonte de eventos más allá del cual la fiabilidad de un modelo de IA comienza a desmoronarse.Este límite está determinado por la distribución de los datos en los que se formó un sistema de IA. Cuando el modelo interactúa con datos diferentes del conjunto de entrenamiento, se encuentra con lo que los expertos llaman un sistema de inteligencia artificial. La generalización en sí misma es la capacidad de un modelo de IA para " “Inputs que nunca se habían visto antes, cuando la generalización es pobre”. » Problema de generalización de “out-of-distribution” (OOD) Gestionar entradas que no se encontraron durante el entrenamiento Puede funcionar perfectamente en los datos sobre los que se ha entrenado, pero fallan miserablemente cuando se enfrentan a nuevos datos. Este tema está relacionado con el concepto de , donde un modelo aprende tanto características relevantes como irrelevantes a la vez para hacer buenas predicciones. Cuando los datos cambian, la influencia de características irrelevantes puede debilitar significativamente la precisión de buenas predicciones. Por ejemplo, un modelo de procesamiento de lenguaje natural (NLP) entrenado en conjuntos con frases altamente específicas puede luchar con el procesamiento exacto e interpretación de frases que no contienen esas frases específicas. Características de contaminación El horizonte de eventos de los modelos de IA es más probable que sea un territorio desconocido en lugar de una región de curvatura infinita.Pero es interesante cómo en los mundos de la IA y la física, una vez que lo cruces, te aventuras al desconocido - y lo impensable podría suceder. Mecánica cuántica: razonamiento probabilístico La IA no es sólo una cuestión de la Teoría de la Relatividad de Einstein, sino también una En el corazón de la mecánica cuántica se encuentra la idea más extraña y loca: la incertidumbre es la característica fundamental del universo. extraña, ¿verdad? una partícula podría, en principio, encontrarse en cualquier lugar hasta que la medimos. De hecho, podrías pensar en esta función de onda como un “mapa de probabilidades”, mostrando dónde podría estar esa partícula o qué tan rápido podría moverse (su impulso). cuántico superposición Claramente, la IA no obedece a las leyes de la mecánica cuántica (o al menos no todavía). pero, al igual que la física cuántica, la IA opera bajo una lógica probabilística en lugar de una lógica determinista.El ejemplo más obvio es ChatGPT. Cuando le damos una advertencia, ChatGPT pasará por una nube masiva (o función de onda) de significados potenciales, para predecir la secuencia de palabras que es más probable articular una frase. El modelo basicamente inferirá qué palabra es más probable que sea la correcta después de la anterior. coherent response En otras palabras, al igual que la física cuántica, la IA se trata de realidades estadísticas, no de absolutos en piedra. El universo en expansión del conocimiento Como muchos científicos de su tiempo, Einstein no estaba convencido de que el universo se estaba expandiendo. sus ecuaciones demuestran que el universo debería expandirse o contraerse, pero él era relutante ante la idea de que el universo podría, de hecho, estar en movimiento en absoluto. , una medida de un cierto efecto "anti-gravedad" (Λ) que compensa la expansión del universo como se describe por sus propias predicciones. En una perspectiva posterior, debería haber confiado en su propia matemática. Gracias a Edwin Hubble, quien en 1929 descubrió que las galaxias se están alejando de nosotros, ahora sabemos que la universidad está realmente expandiéndose. Hubble demostró que tenía razón, incluso cuando estaba equivocado. constante cosmológica El mayor error de mi vida Hay una cierta resonancia entre la dinámica de la expansión del universo descrita por la constante de Hubble y el impacto de la IA. A un nivel básico, se podría argumentar que la IA expande el conocimiento al proporcionar información a los usuarios. Ya sea ChatGPT o un modelo binario, quien introduzca una consulta recibirá una respuesta que pueda ampliar el conocimiento personal, impulsar decisiones de negocio, y así sucesivamente. Además, no solo la IA está escalando la cantidad de datos que recopilamos y procesamos, sino también aprovechándola para aumentar su propio conocimiento operativo. utilizar datos anónimos de las conversaciones de sus usuarios. Periódicamente refinado o ajustado La expansión cósmica es la piedra angular de nuestra comprensión del mundo porque está inherentemente, profundamente ligada a nuestra idea de orden. El Big Bang, de donde surge la expansión cósmica, dio orden al tiempo y al espacio (ver sección siguiente). marcó el momento de desintegración entre un desconocido antes y todo lo que siguió. Lo que antes era (porque no lo sabemos) era inimaginablemente caliente, el después ha estado enfriándose progresivamente desde entonces. Sin influencia externa, un cuerpo que es caliente, como una taza de café, se vuelve lentamente caliente, luego frío. La expansión cósmica describe cómo el universo convierte el caos y las irregularidades en estructura y forma (después de todo, cosmos es una palabra griega que significa “orden”). De manera similar, la IA nos ayuda a convertir el ruido y la ambigüedad en significado y conocimiento. Y lo más asombroso es que ambos procesos son espontáneos y autoorganizados – uno impulsado por la física, el otro por algoritmos. A diferencia de la inflación cósmica, sin embargo, el proceso de expansión de la IA todavía puede detenerse si los humanos están dispuestos a hacerlo. Modelo de radiación de fondo La predicción correcta de Einstein sobre la expansión del universo fue tomada en 1927 por , un físico y sacerdote belga que teorizó lo que hoy llamamos la Teoría del Big Bang (nope, no la sitcom sobrevalorada...).La teoría sigue siendo hoy la respuesta más acreditada a la pregunta de dónde venimos? George Lemaître Hace unos 13,8 mil millones de años, un estado extremadamente caliente y denso, probablemente una singularidad, se expandió rápidamente con una inmensa , proyectando materia, energía, espacio y tiempo hacia el exterior, y luego lentamente comenzó a enfriarse.Este evento fue el catalizador para la formación de toda la materia, incluyendo la formación de galaxias y la ignición de las estrellas. era tan violento que incluso hoy, un poco menos de 14 mil millones de años después, todavía podemos detectar su traslación, en forma de una débil señal permeando el universo y suavemente humillando a través de su tejido. . El bang El bang Radiación de fondo de microondas cósmica Por lo tanto, una radiación relicaria, de un evento catastrófico inicial, sobrevive hoy, aunque a una escala mínima y va desapercibida sin mecanismos sofisticados. Algo bastante similar ocurre en los modelos de IA en relación a los datos de formación, y en particular al concepto de representatividad de los datos. Si los datos son representativos de todos los grupos (género, raza, edad, etnia, orientación sexual, etc.), el modelo es probable que permanezca justo. Por otro lado, si los datos no son representativos (incompletos o biased), el modelo producirá muy probablemente salidas que son discriminatorias involuntariamente hacia determinados grupos. De hecho, la representatividad de los datos es una de las dimensiones clave contra las que un modelo de IA es probado por éticos de IA y expertos en cumplimiento. the data trains your AI model. If you don’t, you will need to mitigate bias post-deployment, to ensure no discrimination takes place (or at least is minimised). And by the way, the Describe los estándares de mejor práctica para probar la equidad y la robustez de su modelo de IA (seguro que vale la pena leerlo, si eres lo suficientemente nerd!). Antes Normas ISO/IEC 24027:2021 De todos modos, el punto de todo es: cuando no se cuida, el vicio persiste y se propaga, al igual que la radiación de fondo cósmica ha sobrevivido a través de miles de millones de años.Y cuando lo hace, el impacto social puede ser no trivial: una candidata femenina brillante podría ser descartada por un modelo predictivo en favor de candidatos masculinos menos cualificados, porque los datos de formación llevaban vicios de género. La buena noticia es que otra vez, a diferencia de la radiación del Big Bang, definitivamente podemos hacer algo al respecto. de jugar a través de las galaxias (si hay algo, dejémoslo venir!). Pero el paradigma de la IA? eso es manejable. Prácticamente un paseo por el pastel. La música del Big Bang La música del Big Bang La decadencia estelar de los modelos de AI No viviré lo suficiente como para ver una estrella colapsar en una estrella de neutrones, pero he aquí, nunca digas nunca.Quién hubiera dicho que podríamos “fotografar” agujeros negros y detectar ondas gravitacionales, y sin embargo, aquí estamos. Si las estrellas de neutrones fueran sólo la mitad del espectáculo que describen los astrofísicos, valdrían la pena un billete de un solo camino al universo para admirarlas.Estas estrellas nacen cuando la gravedad se vuelve tan fuerte que aplasta el núcleo de una supernova.La inmensa fuerza a la que está sujeto conduce a un núcleo compacto y denso donde los protones y los electrones se combinan en neutrones. de las representaciones. núcleos Visto desde lejos, veríamos una estrella de incomprensible belleza, bastante pequeña en tamaño (10-12 km de diámetro) pero incomprensiblemente poderosa en densidad (metad de un bastón de sushi podría pesar mil millones de toneladas) y gravedad (alrededor de 200 mil millones de veces más fuerte que la de la Tierra). Una estrella con una superficie engañosa, suave y suave para el ojo, pero capaz de aplastarte en pedazos tan pronto como lo toques. Un modelo de IA que genera las imágenes más realistas, pero capaz de desalinear brutalmente el tronco de un árbol desde su canopy o un dedo de su mano. Una estrella que ofrece una danza fascinante de giros ultra rápidos, entrelazada con una luz frenética de rayos X. Un chatbot de IA escri Lucha por la supervivencia Lo que parece ser la creación más asombrosa del universo, o el sistema de modelo de IA de mejor rendimiento, está realmente luchando por la existencia.La estrella de neutrones está haciendo su mejor esfuerzo para resistir la asombrosa fuerza gravitacional que quisiera aplastarla, y por eso despliega la , que está luchando con la gravedad, empujando hacia afuera y resistiendo al colapso. Del mismo modo, en otro rincón del universo, un modelo de IA está luchando contra la atracción implacable de datos ruidosos y prejudicados, que querrían desestabilizarlo y empujarlo para producir salidas irrelevantes o incluso dañinas. o , which mitigate the risks of the model to overfit or collapse into extreme values. Presión de degeneración de neutrones Regularización Espartanos Presión de degeneración de neutrones Pero no se equivoque: es un equilibrio delicado. El evento de disrupción mínimo podría causar que la gravedad y los prejuicios triunfen. Una vez que la presión de degeneración de neutrones cede a la gravedad (tal vez porque esa estrella ha incorporado materia extraída de otras estrellas, aumentando el apalancamiento de la gravedad), el colapso es inevitable. Como un rey codicioso, la gravedad impone su supremacía y se vuelve inestable. Al mismo tiempo, las salvaguardas del modelo aplicado pueden no resistir el atraco de datos infinitos, tal vez porque ha absorbido demasiada o demasiado variada información, y su estabilidad comienza a romperse. . excesiva y la pérdida de una generalización significativa El espacio-tiempo se curva cada vez más. Preanunciado por la formación de un horizonte de eventos, la estrella de neutrones colapsa en un agujero negro. La velocidad de escape ahora ha superado la velocidad de la luz, lo que significa que la luz ya no puede escapar. En un giro dramático de los eventos, ese hermoso ángel blanco etérico se transforma en un agujero negro. Y al igual que las supernovas siembran nuevas estrellas y alimentan el cosmos, los remanentes de nuestro modelo de IA – esos pesos ajustados y lecciones aprendidas del fracaso anterior del modelo – pueden ser el punto de partida para construir la arquitectura de la próxima generación. En ambos casos, vemos un ciclo de transformación, donde incluso el mínimo desequilibrio puede causar que la estabilidad caiga de un momento a otro. En entangled y everywhere: AI y Qubits Cuando pienso en cuáles son los problemas más aterradores y urgentes que enfrenta la humanidad a largo plazo, mi mente se dirige directamente a tres emergencias: los impactos climáticos, las crisis demográficas y la computación cuántica. La computación cuántica está ganando lentamente pero constantemente relevancia en todo el mundo, con los informes de noticias ocasionales de este o aquel chip cuántico siendo producido por Microsoft u otros jugadores de la tecnología. Se le concedió el . John Martinis Premio Nobel de Física este año Pero la verdad es que una vez que podamos construir eficazmente computadoras cuánticas a gran escala, no simplemente leeremos un artículo aleatorio y obscuro al respecto.Nuestras vidas serán severamente afectadas por esta tecnología.Sólo basta con decir que, en principio, una computadora cuántica a gran escala podría ser lo suficientemente poderosa como para ( ) de En teoría, podría permitir que un país haga más fácil robar los secretos clasificados de otro país, quizás relacionados con la defensa.Se puede imaginar los efectos en cascada de dicha tecnología si no se regula y controla adecuadamente. Afortunadamente, este escenario distópico todavía es teórico en la actualidad, y los estándares de cifrado cuántico-seguros están siendo Para predecir esto. Entre otras Bloqueo de cifrado de alto nivel Desarrollado por NIST La computación cuántica toma su nombre de los principios de la mecánica cuántica.En primer lugar, la mecánica cuántica introdujo el concepto de (una partícula puede estar en cualquier lugar hasta que se observa y mide).Esta lógica se aplica a los qubits de las computadoras cuánticas (= bits cuánticos). Esta propiedad es, y va a, ampliar las capacidades de una computadora más allá de nuestra imaginación (es decir, realizar múltiples cálculos simultáneamente). , la propiedad de dos partículas para influir entre sí a una distancia. lo mismo ocurre en la computación cuántica: los qubits pueden relacionarse de manera similar y afectarse entre sí independientemente de la distancia. superposition Combinación de estados entre 1 y 0 simultáneamente entanglement Entonces, ¿dónde se encaixa la IA en todo esto?Aunque los conceptos distintos, la IA y la computación cuántica están fuertemente interconectados. computación cuántica, por ejemplo, diseñando circuitos cuánticos mejores y libres de errores, o ajustando finamente las máquinas cuánticas para la estabilidad y el rendimiento.[23] Por otro lado, en el futuro, las computadoras cuánticas podrían ayudar a procesar conjuntos de datos masivos para la IA, exponencialmente más rápido que nuestras computadoras. Optimización y calibración Algunos paralelos son más precisos, otros quizás un poco forzados.Espero que no hayas tomado lo anterior demasiado en serio: vea lo que es: nada más que un intelectual. . Entretenimiento