paint-brush
Un gran paso para la IA: 3D-LLM libera modelos de lenguaje en el mundo 3D por@whatsai
3,173 lecturas
3,173 lecturas

Un gran paso para la IA: 3D-LLM libera modelos de lenguaje en el mundo 3D

por Louis Bouchard
Louis Bouchard HackerNoon profile picture

Louis Bouchard

@whatsai

I explain Artificial Intelligence terms and news to non-experts.

2 min read2023/08/11
Read on Terminal Reader
Read this story in a terminal
Print this story

Demasiado Largo; Para Leer

3D-LLM es un modelo novedoso que cierra la brecha entre el lenguaje y el reino 3D que habitamos. No solo percibe el mundo sino que también interactúa con él. El mundo que ve puede no ser convencionalmente hermoso, pero su comprensión está profundamente arraigada en las nubes de puntos y el lenguaje.
featured image - Un gran paso para la IA: 3D-LLM libera modelos de lenguaje en el mundo 3D
Louis Bouchard HackerNoon profile picture
Louis Bouchard

Louis Bouchard

@whatsai

I explain Artificial Intelligence terms and news to non-experts.

0-item

STORY’S CREDIBILITY

DYOR

DYOR

The writer is smart, but don't just like, take their word for it. #DoYourOwnResearch before making any investment decisions or decisions regarding your health or security. (Do not regard any of this content as professional investment advice, or health advice)

Hemos sido testigos de las notables capacidades de los modelos de lenguaje extenso (LLM), pero ha habido una brecha: una pieza faltante en su comprensión del mundo que nos rodea. Se han destacado con el texto, el código y las imágenes, pero han tenido problemas para interactuar verdaderamente con nuestra realidad. Es decir, hasta ahora. Aquí hay un avance innovador en el panorama de la IA: 3D-LLM.


3D-LLM es un modelo novedoso que cierra la brecha entre el lenguaje y el reino 3D que habitamos. Si bien no cubre la totalidad de nuestro mundo, es un paso monumental en la comprensión de las dimensiones cruciales y el texto que dan forma a nuestras vidas. Como descubrirá en el video, 3D-LLM no solo percibe el mundo sino que también interactúa con él. Puede hacer preguntas sobre el entorno, buscar objetos o navegar por los espacios, y ser testigo de su razonamiento de sentido común, que recuerda las impresionantes hazañas que hemos experimentado con ChatGPT.


Curiosamente, el mundo que ve puede no ser convencionalmente hermoso, pero su comprensión está profundamente arraigada en las nubes de puntos y el lenguaje. Las nubes de puntos, la base de la representación de datos 3D, codifican coordenadas espaciales de objetos y entornos, lo que permite que la IA interactúe con el mundo real de manera tangible. Piense en su papel en la conducción autónoma, la robótica y la realidad aumentada: 3D-LLM aprovecha este ámbito.


Curiosamente, podría preguntarse cómo se entrenó un modelo de este tipo para comprender datos y lenguaje tridimensionales. El proceso fue innovador y complejo, con los autores construyendo un conjunto de datos de texto 3D único. Aprovecharon la destreza de ChatGPT para recopilar estos datos a través de tres métodos distintos que aprenderá, creando un repositorio completo de tareas y ejemplos para cada escena.


A partir de este rico conjunto de datos, los autores forjaron un modelo de IA capaz de procesar texto y nubes de puntos 3D. El modelo toma la escena, extrae características cruciales a través de varias perspectivas y la reconstruye en una forma que resuena con la comprensión del modelo.


¿El resultado? El nacimiento del primer 3D-LLM, un modelo que realmente ve y comprende nuestro mundo, ofreciendo una mirada intrigante a la evolución de la IA. El video ofrece una instantánea del viaje, pero lo animo a explorar el documento para profundizar en las impresionantes proezas de ingeniería detrás de esta innovación. El enlace se proporciona en las referencias a continuación.

¡Disfruta el espectáculo!

Mira el video para aprender mas:


Referencias:

►Lea el artículo completo: https://www.louisbouchard.ai/3d-llm/

►Página del proyecto con demostración en video: https://vis-www.cs.umass.edu/3dllm/ ►Código: https://github.com/UMass-Foundation-Model/3D-LLM

►Artículo: Hong et al., 2023: 3D-LLM, https://arxiv.org/pdf/2307.12981.pdf

►Twitter: https://twitter.com/Whats_AI

►My Newsletter (¡Una nueva aplicación de IA explicada semanalmente en sus correos electrónicos!): https://www.louisbouchard.ai/newsletter/

►Apóyame en Patreon: https://www.patreon.com/whatsai

►Únete a nuestro Discord de IA: https://discord.gg/learnaitogether

L O A D I N G
. . . comments & more!

About Author

Louis Bouchard HackerNoon profile picture
Louis Bouchard@whatsai
I explain Artificial Intelligence terms and news to non-experts.

ETIQUETAS

ESTE ARTÍCULO FUE PRESENTADO EN...

Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite
X REMOVE AD