Vimos el surgimiento de un nuevo gigante de IA generativa, OpenAI, con la introducción de ChatGPT en noviembre de 2022. ChatGPT sirve como una interfaz orientada al chat para el modelo subyacente que emplea. La primera versión del chatbot se basó en un gran modelo de lenguaje llamado GPT-3.5. Pero el martes 14 de marzo de 2023, 4 meses después del primer lanzamiento de ChatGPT, OpenAI anima las cosas con el lanzamiento de GPT-4, un modelo más capaz que las versiones anteriores. Inicialmente diseñado para interactuar con GPT-3.5, el chatbot ahora funciona como un medio para interactuar con GPT-4.
Lo mismo que puede hacer GPT-3.5, pero más. La compañía dijo en una publicación de blog,
"GPT-4 es más confiable, creativo y capaz de manejar instrucciones mucho más matizadas que GPT-3.5".
Desde 2018, OpenAI ha estado difundiendo modelos de lenguaje GPT, pero de todos los enormes modelos de lenguaje de Open AI, GPT-4 no solo es el más nuevo, sino también el más potente. OpenAI informó que usó Microsoft Azure para entrenar el modelo. Aquí hay un par de formas en que GPT-4 se compara con GPT-3.5
GPT-4 acepta entradas visuales y GPT-3.5 no
Dado que GPT-4 es "multimodal", según lo especificado por OpenAI, y puede comprender muchas "modalidades" de información, se le puede solicitar que produzca contenido tanto mediante señales visuales como textuales, mientras que GPT-3.5 esencialmente podía leer y escribir texto. . Sin embargo, la compañía no está implementando su capacidad de descripción de imágenes de inmediato, y la versión GPT-4 permanece disponible solo para suscriptores de usuarios y desarrolladores de ChatGPT Plus de OpenAI, y solo admite texto.
En comparación con GPT-3.5, GPT-4 tiene un búfer más grande
En pocas palabras, GPT-4 tiene una memoria más larga que el modelo anterior. Con GPT-3.5 y la iteración anterior de ChatGPT, el máximo fue de 4096 "tokens", o aproximadamente 8000 palabras, mientras que el recuento máximo de tokens para GPT-4 es de 32 768, o alrededor de 64 000 palabras. Eso es 8 veces más capacidad de memoria.
GPT-4 tiene una variedad de "personas". o maniobrabilidad, a diferencia de GPT-3.5
La capacidad de dirección se refiere a la capacidad de controlar o influir en la salida de un modelo de lenguaje en una dirección o estilo específico. En otras palabras, permite a los usuarios guiar el modelo de lenguaje para producir texto que se ajuste a un tono, estilo o tema en particular. Si bien GPT-3 no tiene funciones de dirección integradas, GPT-4 sí. Con GPT-4, los desarrolladores y los usuarios de ChatGPT pueden especificar el estilo y la tarea de su IA dando dichas instrucciones en el mensaje del "sistema", a diferencia de la personalidad tradicional de ChatGPT con una verbosidad, un tono y un estilo definidos. La compañía declaró que, aunque actualmente solo los desarrolladores pueden acceder a esta función, pronto también estará disponible para los usuarios de ChatGPT.
GPT-4 tiene una gama de idiomas más amplia.
Esto significa que GPT-4 puede comprender y generar texto en una variedad más amplia de idiomas que su predecesor GPT-3.5. Este es un avance significativo en el campo del procesamiento del lenguaje natural. Según OpenAI, GPT-4 supera el rendimiento en inglés de GPT-3.5 y otros LLM en 24 de los 26 idiomas que probaron. Como resultado, GPT-4 puede responder con precisión a una gran cantidad de preguntas de opción múltiple en 26 idiomas diferentes.
GPT-4 tiene menos 'alucinaciones' sobre los hechos
Aunque no detiene por completo las alucinaciones, GPT-4 las disminuye considerablemente en comparación con variantes anteriores. Sin embargo, hay una advertencia, GPT-4 todavía no es completamente confiable. La compañía dijo que el modelo de lenguaje actualizado continúa "alucinando" los hechos y exhibe una lógica defectuosa, aunque no tan mala como GPT-3.5. Las alucinaciones en el contexto del software modelo de lenguaje se refieren a la generación de texto que parece ser coherente y significativo pero que en realidad no está respaldado por los datos de entrada. Esto puede ocurrir cuando un modelo de lenguaje genera texto que no está basado en el contexto o no es coherente con el significado semántico del texto de entrada.
En otras palabras, un modelo de lenguaje a veces puede generar texto que no es preciso o plausible en función de la información con la que ha sido entrenado, lo que resulta en lo que comúnmente se conoce como "alucinaciones". El modelo también incorpora sesgos sociales y avisos contradictorios además de la restricción anterior. La publicación del blog de OpenAI decía:
"GPT-4 obtiene un puntaje 40% más alto que el último GPT-3.5 en evaluaciones internas de factualidad contradictoria".
Según The Washington Post, los LLM han aprendido a imitar los prejuicios humanos de raza, género, religión y clase como resultado de su capacitación en textos e imágenes de Internet.
GPT-4 también tiene restricciones adicionales similares a las que se encuentran en GPT-3.5, una de las cuales es que todavía carece de conocimiento de los eventos que ocurrieron después de septiembre de 2021. La capacidad de otros para enseñarle cosas nuevas también está limitada por el hecho de que no aprende de sus experiencias. Independientemente, GPT-4 es aún más inteligente; ya que es más preciso, más preciso y tiene una mejor experiencia.
El modelo de lenguaje también ha demostrado que es capaz de sobresalir en los exámenes. Según OpenAI, obtuvo un puntaje en el percentil 90 en un examen de barra simulado, el percentil 93 en una prueba de lectura SAT y el percentil 89 en una prueba de matemáticas SAT.
GPT-4 tiene el potencial de usarse en una amplia gama de aplicaciones que requieren comprensión y generación de lenguaje natural. El software de aprendizaje de idiomas Duolingo, el proveedor de pagos Stripe, la plataforma de aprendizaje en línea Khan Academy y la empresa de servicios financieros Morgan Stanley se encuentran entre las empresas mencionadas en el comunicado de OpenAI que actualmente utilizan el nuevo modelo.
Microsoft también informó que su chatbot, BingAI, ha estado usando GPT-4 todo el tiempo, incluso antes del lanzamiento público del modelo.
"Nos complace confirmar que el nuevo Bing se ejecuta en GPT-4, que hemos personalizado para la búsqueda. Si ha utilizado la nueva vista previa de Bing en cualquier momento durante las últimas cinco semanas, ya ha experimentado una primera versión de este poderoso modelo.”
Yusuf Mehdi, vicepresidente corporativo y director de marketing para consumidores de Microsoft, escribió en un comunicado.
GPT-4 "sobresale en tareas que requieren razonamiento avanzado, comprensión de instrucciones complicadas y más creatividad", según OpenAI.
Los usuarios han informado sobre el uso de GPT-4 en una variedad de formas ingeniosas en el breve tiempo transcurrido desde su lanzamiento:
Se cree que las posibilidades de esta nueva herramienta son infinitas.
\Fundamentalmente, para acceder a ChatGPT, primero debe registrarse en OpenAI
Dado que Microsoft ha confirmado que el nuevo Bing se ejecuta en el nuevo modelo de GPT, es obvio que millones de usuarios de Bing ya pueden acceder a él a través del chatbot.
También se puede acceder al nuevo modelo a través de la API, la compañía declaró que están priorizando el acceso a la API para los desarrolladores que brindan evaluaciones de modelos sobresalientes a OpenAI Evals durante el lento lanzamiento de GPT-4 para aprender cómo pueden mejorar el modelo para todos.