Los modelos recientes de IA, como   y   han mostrado capacidades impresionantes para generar texto e imágenes. ChatGPT Midjourney,  Sin embargo, también hay modelos que se especializan en comprender estas entradas, como Vision Transformers (ViT) para imágenes y Pathways language model (PaLM) para texto. Estos modelos pueden interpretar y comprender el significado de imágenes y oraciones.  La combinación de modelos de texto e imagen daría como resultado una IA que puede comprender varias formas de datos y podría comprender casi todo.  Sin embargo, las capacidades de dicho modelo pueden parecer limitadas a primera vista, ya que solo sería capaz de entender cosas. Pero, ¿y si este modelo se integra con un sistema robótico que puede moverse en el mundo físico? Aquí es donde entra PaLM-E.  ¿Qué es el modelo de IA PaLM-E de Google?  La última publicación de Google, PaLM-E, es un   . modelo de lenguaje multimodal incorporado  Esto significa que es un modelo que puede interpretar y comprender varios tipos de datos, incluidas imágenes y texto de los modelos ViT y PaLM respectivamente, y convertir esta información en acciones a través de una mano robótica.  Aprende más en el vídeo...   https://youtu.be/1RF06BL7VAc?embedable=true&transcript=true

Watch more on YouTube: https://www.youtube.com/c/WhatsAI

I explain Artificial Intelligence terms and news to non-experts.

2021 - HackerNoon Contributor of the Year - FACEBOOK

2022 - Best Data Science Newsletter

2022 - HackerNoon Contributor of the Year - Artificial Intelligence

2022 - HackerNoon Contributor of the Year - Computer Vision

2022 - HackerNoon Contributor of the Year - Data Science

2022 - HackerNoon Contributor of the Year - Google

2022 - HackerNoon Contributor of the Year - Innovation

2022 - HackerNoon Contributor of the Year - Machine Learning

2022 - HackerNoon Contributor of the Year - Natural Language Processing

2022 - Top Tech Youtuber

2021 - HackerNoon Contributor of the Year - DEEP-LEARNING

Nominated for 2022 - Best Data Science Newsletter

Nominated for 2022 - HackerNoon Contributor of the Year - Artificial Intelligence

Nominated for 2022 - Top Tech Youtuber

Nominated for 2022 - HackerNoon Contributor of the Year - Innovation

Nominated for 2022 - HackerNoon Contributor of the Year - Data Science

Nominated for 2022 - HackerNoon Contributor of the Year - Natural Language Processing

PaLM-E (robot AI) de Google puede ver y comprender el lenguaje

About Author

COMENTARIOS

ETIQUETAS

ESTE ARTÍCULO FUE PRESENTADO EN

Related Stories

Valhalla de Floki se une como patrocinador asociado de la gira de la India por Sri Lanka

Telegram: el puente de Crypto Island hacia el continente

Liberando el poder de la IA. Una revisión sistemática de técnicas de vanguardia: resumen e introducción

Una breve introducción a la teoría del cerebro de Boltzmann

Valhalla de Floki se une como patrocinador asociado de la gira de la India por Sri Lanka

Telegram: el puente de Crypto Island hacia el continente

Liberando el poder de la IA. Una revisión sistemática de técnicas de vanguardia: resumen e introducción

Una breve introducción a la teoría del cerebro de Boltzmann

Light-Mode

Classic

Newspaper

Dark-Mode

Neon Noir

Minty

HN StartUps