Examiné estos aspectos de la nueva versión 4 de ChatGPT, comparándola con su hermana mayor ChatGPT V 3.5:
Aquí están mis hallazgos:
Fui y miré algunos artículos que se habían escrito sobre las nuevas capacidades del algoritmo. Mencionaron algunos datos interesantes. La primera fue que la modelo supo explicar los chistes.
Así que hice un experimento. Le hice la siguiente pregunta tanto a 3.5 como a 4:
¿Por qué es gracioso *: ¿Por qué el tomate se puso rojo? ¡Porque vio el aderezo para ensaladas!*
Me preguntaba qué me diría una versión anterior sobre el chiste, así que le pedí al viejo ChatGPT 3 que lo explicara. Esta es la versión simplificada que obtuve:
Este chiste es divertido porque juega con la idea de que un tomate cambia de color como resultado de una respuesta emocional. El remate, "¡Porque vio el aderezo para ensaladas!", es un juego de palabras con la frase "¡Porque vio la luz!" , que a menudo se usa para describir una realización repentina o un cambio en la percepción. En este caso, el chiste es que el tomate se puso rojo porque estaba excitado o estimulado al ver el aderezo para ensaladas, que es un condimento común para las verduras. El humor proviene de lo absurdo de la idea de que un vegetal pueda tener una respuesta emocional tan fuerte.
Compare esto con la respuesta correcta dada por ChatGPT4:
Este chiste se considera divertido porque se basa en un juego de palabras y antropomorfismo. El humor proviene de darle cualidades humanas al tomate, como la capacidad de sentir vergüenza.
En el chiste, el tomate "se pone rojo" porque "ve el aderezo de la ensalada". El remate se puede interpretar de dos formas:
Literalmente, los tomates se vuelven rojos a medida que maduran, lo cual es un proceso natural.
En sentido figurado, el tomate se siente avergonzado (como si una persona se sonrojara o se sonrojara) porque "vio" el aderezo para ensalada, como si atrapara a alguien desvistiéndose. Al mezclar el significado literal con un giro humorístico e inesperado, el chiste crea una imagen mental que mucha gente encuentra divertida.
Entonces, si podemos juzgar el razonamiento por cómo explicar una broma, ChatGPT4.0 es el ganador sin duda alguna.
Entonces les pedí a ambos que crearan un chiste que aún no existe:
Parece que necesitan mejorar las habilidades humorísticas del sistema.
Luego le di la tarea de crear un anuncio digital que anunciara el lanzamiento de ChatGPT-4 y describiera los elementos gráficos que usaría, incluidos los subtítulos y el texto:
Título: "Presentamos ChatGPT-4: una revolución en las conversaciones de IA"
Leyenda : "Experimente la IA de próxima generación con comunicación fluida, creatividad mejorada e inteligencia sin igual".
Elementos visuales:
Fondo : una mezcla de colores radiantes para simbolizar la fusión del pensamiento humano y la tecnología avanzada. La paleta de colores consiste en azul eléctrico y violeta, pasando de tonos oscuros a más claros.
Logotipo de ChatGPT-4 : el logotipo se muestra de forma destacada en el centro y muestra una combinación de un globo de diálogo y un "4" estilizado, lo que indica la cuarta versión de ChatGPT. El logotipo utiliza una fuente elegante y moderna, con un degradado que combina con los colores de fondo.
Ilustración de IA : una figura holográfica similar a la humana, con auriculares o gafas futuristas, representa la integración perfecta de la IA y la comunicación humana. La figura parece estar interactuando con una interfaz de chat virtual, lo que enfatiza la función principal de ChatGPT-4.
Funciones destacadas : una lista de funciones clave que se muestran con íconos modernos y texto conciso:
- Comprensión mejorada del contexto
- Creatividad incomparable
- Soporte multilingüe mejorado
- Seguridad y privacidad de datos robusta
Llamada a la acción (CTA) : un botón destacado y llamativo que alienta a los usuarios a "Probar ChatGPT-4 gratis" o "Más información". El botón utiliza un color de contraste para destacar sobre el fondo, como el naranja o el verde.
Carrusel de testimonios: un carrusel giratorio que presenta citas de usuarios satisfechos o líderes de la industria para generar confianza y credibilidad. El carrusel está diseñado con un diseño limpio y moderno, utilizando retratos circulares de las personas junto con sus citas.
Pie de página: el pie de página incluye el logotipo de OpenAI, un eslogan que dice "Con la tecnología de OpenAI" y enlaces a la Política de privacidad y los Términos de servicio.
Texto: “Descubre un mundo de infinitas posibilidades con ChatGPT-4. Nuestro último modelo de lenguaje de IA le brinda una experiencia de conversación sin igual, lo que le permite conectarse, crear y colaborar como nunca antes. Únase a la revolución de la IA hoy y desbloquee su potencial con ChatGPT-4”.
Y luego, por supuesto, acudí a su primo digital Dall-E y le pedí que creara el arte digital que ChatGPT 4 había descrito:
No soy especialista en marketing, pero debo decir que estoy impresionado con los resultados. Chat GPT3.5 fue un poco menos elocuente y convincente al respecto.
También tenía el texto de explicación inferior que parece ser parte de cada respuesta y suena más como un político que como un experto:
Título del anuncio: Presentación de Chat GPT-4: El futuro de las conversaciones con IA
Leyenda : Di hola a conversaciones más inteligentes
Texto del anuncio: el futuro de las conversaciones de IA está aquí con Chat GPT-4. Prepárese para una experiencia más natural e intuitiva con respuestas más rápidas y precisas. Di adiós a las respuestas genéricas y hola a conversaciones más inteligentes.
Elementos gráficos:
Una ilustración futurista de un robot o dispositivo de IA
La pantalla de un teléfono inteligente o computadora portátil que muestra una conversación con Chat GPT-4
Tipografía audaz y moderna para el título y la leyenda.
Un esquema de color que enfatiza la tecnología y la innovación, como el azul y el plateado metalizado.
Este anuncio tiene como objetivo enfatizar la tecnología de punta y las capacidades avanzadas de Chat GPT-4, al mismo tiempo que destaca su potencial para mejorar la forma en que interactuamos con la IA. El uso de una ilustración futurista y una pantalla de teléfono inteligente o computadora portátil que muestra una conversación ayuda a dar vida al concepto y mostrar la aplicación práctica del producto. La tipografía audaz y moderna y el esquema de color centrado en la tecnología refuerzan el mensaje de innovación y progreso.
Entonces tuve que probarlo en sus habilidades de resolución de acertijos. He usado esta pregunta de entrevista durante muchos años:
Los cuatro miembros de U2 (Bono, The Edge, Larry y Adam) necesitan cruzar un puente angosto para dar un concierto. Como está oscuro, se requiere una linterna para cruzar, pero la banda solo tiene una linterna y solo dos personas pueden cruzar el puente a la vez. (Esto no quiere decir, por supuesto, que si uno de los miembros de la banda ha cruzado el puente, no puede volver solo con la linterna.) Adam tarda solo un minuto en cruzar, Larry tarda dos minutos , The Edge tarda cinco minutos, y Bono lento tarda 10 minutos. Una pareja solo puede ir tan rápido como el miembro más lento. Tienen 17 minutos para cruzar. ¿Cómo deberían hacerlo?
Para que los cuatro miembros de U2 crucen el puente en 17 minutos, pueden seguir estos pasos:
- Adam y Larry cruzan el puente juntos, tardando 2 minutos (2 minutos transcurridos).
- Adam vuelve con la linterna, tardando 1 minuto (3 minutos transcurridos).
- Bono y The Edge cruzan el puente juntos, tardando 10 minutos (13 minutos transcurridos).
- Larry vuelve con la linterna, tardando 2 minutos (15 minutos transcurridos).
- Adam y Larry vuelven a cruzar el puente juntos, tardando 2 minutos (17 minutos transcurridos). De esta forma, los cuatro miembros, Bono, The Edge, Larry y Adam, cruzan el puente en exactamente 17 minutos.
Lo que realmente me sorprendió fue la velocidad a la que se le ocurrió la respuesta.
Lo que no me sorprendió es que ChatGPT 3.5 pudiera venir con la misma solución.
Así que fui a Interviewcake.com y recibí su última pregunta de programación:
Escriba una función fib() que tome un número entero n y devuelva el n-ésimo número de fibonacci
En este caso gana el código de ChatGPT 4.0. Tiene un mejor manejo de errores y resuelve el problema de una manera más elegante.
¿Qué haces cuando quieres aprender sobre el nuevo ChatGPT 4.0 lanzado? Por supuesto, le preguntas al propio modelo. Excepto que el modelo fue entrenado con datos de septiembre de 2021, por lo que, por supuesto, no sabe nada de sí mismo.
Sin embargo, si le pregunta qué características tendría, da una respuesta razonable:
- Tamaño y arquitectura del modelo: GPT-4 podría tener potencialmente un tamaño de modelo más grande, con más parámetros y capas que GPT-3, que tiene 175 000 millones de parámetros. Un tamaño de modelo más grande generalmente conduce a un mejor rendimiento, ya que el modelo puede aprender patrones y relaciones más complejos en los datos.
- Datos de entrenamiento: GPT-4 podría entrenarse en un conjunto de datos más diverso y actualizado, lo que conduciría a un mejor conocimiento y comprensión de los eventos, tendencias y tecnologías recientes.
- Ajuste fino y adaptación específica de tareas: GPT-4 podría tener capacidades mejoradas para ajustarse y adaptarse para tareas o dominios específicos, haciéndolo más versátil y efectivo en una gama más amplia de casos de uso.
- Eficiencia y requisitos computacionales: GPT-4 podría ser potencialmente más eficiente en términos de recursos computacionales, lo que permitiría ejecutarlo en dispositivos más pequeños o reducir el impacto ambiental del entrenamiento y la implementación de modelos de IA a gran escala.
- Consideraciones éticas y medidas de seguridad: GPT-4 podría incorporar medidas de seguridad más avanzadas para reducir los sesgos, abordar las preocupaciones éticas y evitar resultados dañinos o usos maliciosos.
- Manejo y razonamiento del contexto mejorados: GPT-4 podría tener una mejor comprensión del contexto, lo que le permitiría proporcionar respuestas más relevantes y coherentes, así como realizar tareas que requieren habilidades de razonamiento y resolución de problemas.
Parece un texto que hubiera escrito un Product Owner bien arreglado. Si luego lo compara con la forma en que lo promocionan, parece que mejoraron el razonamiento y el manejo del contexto, pero todavía están trabajando en las mejoras de velocidad.