Autores:
(1) Renato P. dos Santos, CIAGE – Centro de Inteligencia Artificial Generativa en Cognición y Educación.
Conceptualizando reacciones químicas
Profundización en la comprensión de las reacciones químicas.
Pregunta sobre una gráfica de gases que se convierten en agua con el tiempo
Pregunta sobre la diferencia entre átomos, moléculas y moles.
Profundizando en el concepto de mole
Pregunta sobre el cambio de estado.
Pregunta sobre una representación animada de moléculas de agua en cambios de fase.
Pregunta sobre el plasma, un estado de la materia.
Pregunta sobre enlaces químicos
Pregunta sobre la ilustración de enlaces químicos.
Pregunta sobre la esencia del tipo de enlace químico.
Limitaciones del estudio y posibles estudios futuros.
Contribuciones de los autores, conflictos de intereses, agradecimientos y referencias
Los hallazgos de este estudio difieren de los de Gregorcic y Pendrill (2023), quienes sostuvieron que a pesar de rectificar errores y contradicciones a través del diálogo socrático, ChatGPT no cumplía con los criterios necesarios para funcionar como tutor de física. Esta disparidad podría deberse al uso de una versión más antigua y menos avanzada de ChatGPT, específicamente el modelo GPT-3 introducido por OpenAI en 2020 (Brown et al., 2020).
Nuestra investigación indica que las versiones actuales de ChatGPT, Bing Chat, Bard y Claude pueden actuar como objetos efectivos para pensar, según el concepto de Papert (1980, p. 11), cultivando un aprendizaje atractivo, interactivo e inclusivo. ambiente. Estas herramientas de IA pueden respaldar la creatividad, la colaboración, la exploración, el pensamiento crítico y la resolución de problemas, lo que potencialmente profundiza la comprensión del tema. Esto se relaciona con la comparación entre ChatGPT, Bard y Bing Chat en el estudio de Liu et al. (2023).
El éxito general de este viaje educativo, con GenAIbots sirviendo como agentes para pensar, destaca algunas estrategias de enseñanza efectivas que pueden facilitar una comprensión profunda de los conceptos involucrados. Una parte importante del proceso implicó un refuerzo positivo, ya que los GenAIbots reconocieron que las observaciones de los estudiantes eran agradables, validaban sus experiencias y estimulaban su curiosidad. Además, siguiendo a Gregorcic y Pendrill (2023), adoptamos lo que podría verse como una estrategia de diálogo de tipo socrático, que incita a los estudiantes a pensar de manera crítica y participar activamente en su aprendizaje en lugar de simplemente brindarles respuestas. GenAIbots también aprovechó el conocimiento existente del estudiante al preguntarle sobre su comprensión de temas como el peso y la gravedad, estableciendo así un puente significativo entre la información nueva y la aprendida previamente.
Sobre la base del estudio preliminar de Bitzenbauer (2023), que destacó el potencial de los chatbots basados en modelos de lenguaje expansivo, incluido ChatGPT, para enriquecer las experiencias de aprendizaje, y la afirmación de Adiguzel et al. (2023) sobre el potencial transformador de ChatGPT en la educación a través de instrucción personalizada y real. -Retroalimentación en tiempo, nuestra investigación enfatiza los beneficios de la integración de la IA en entornos de aprendizaje. Los chatbots impulsados por IA como ChatGPT, Bing Chat, Bard, Claude y otros modelos generativos podrían servir como agentes avanzados para abordar escenarios de aprendizaje desafiantes, ampliar el conocimiento de los estudiantes de manera incremental y brindar explicaciones, ejemplos y analogías relevantes para respaldar su aprendizaje. Este estudio destaca el potencial de las herramientas impulsadas por la IA para promover el aprendizaje activo, la instrucción personalizada y la comprensión conceptual en Química. Subraya el valor de la IA para mejorar las experiencias educativas y concluye que los GenAIbots pueden servir como plataformas innovadoras para explorar escenarios educativos desafiantes.
Sin embargo, nuestro análisis revela que ChatGPT y Claude brindaron consistentemente respuestas más completas, detalladas y precisas que Bing Chat, que tendía a brindar respuestas más breves y menos informativas. ChatGPT-4 pudo adaptar las respuestas a las preguntas de los estudiantes, abordar conceptos erróneos y ofrecer explicaciones personalizadas. ChatGPT también fue más hábil a la hora de abordar los matices y sutilezas de las preguntas, reconocer el contexto e interactuar con la perspectiva o interpretación única del usuario. Por otro lado, Bing Chat a menudo no abordaba estos matices y proporcionaba menos información contextual. En general, ChatGPT y Claude demostraron una comprensión superior del tema y una capacidad más notable para transmitir conceptos científicos complejos de una manera accesible.
El estudio también destacó la necesidad de una formación integral de los educadores antes de integrar estas herramientas en las aulas. Una formación adecuada capacita a los profesores para guiar a los estudiantes de forma eficaz en la articulación de sus pensamientos y la construcción de argumentos sólidos. Esta preparación permitiría a los educadores evaluar el desempeño de los GenAIbots cuando se enfrenten a contraejemplos convincentes, fomentando debates productivos entre colegas.
Finalmente, es fundamental mencionar que los resultados de esta experiencia revelaron variaciones significativas en el desempeño de ChatGPT, Bing Chat, Bard y Claude. Este resultado concuerda con Franciscu (2023), en el que ChatGPT, un modelo de generación de lenguaje natural de vanguardia, sobresale en producir respuestas similares a las humanas adecuadas para chatbots. Según el análisis detallado anterior, a pesar de algunas similitudes fundamentales, ChatGPT superó notablemente a BingChat, con Bard y Claude siguiendo de cerca el desempeño de ChatGPT y mostrando niveles de competencia comparables entre ellos, como se describe a continuación y se resume en la Tabla 2.
1. ChatGPT se destaca por su personalización constante y su toque personal a través de mecanismos de retroalimentación y refuerzo positivo. Emplea estrategias de instrucción efectivas, a menudo desglosa las explicaciones de manera sistemática y con frecuencia involucra a los usuarios con compromiso e interactividad al solicitar comentarios. Con talento para el uso de analogías e ilustraciones comparativas , ChatGPT traduce conceptos abstractos en escenarios identificables. Su profundidad detallada y recomendación de contenido es personalizada y completa, y ocasionalmente se aventura en metadiscusión y encuadre de perspectiva para proporcionar contextos más amplios.
2. Los puntos fuertes de Claude residen predominantemente en la personalización y el tacto agradable y el compromiso y la interactividad , lo que hace que el aprendizaje se sienta como un diálogo interactivo. Al ofrecer explicaciones sencillas, se apoya en gran medida en el uso de analogías e ilustraciones comparativas, especialmente cuando se basa en los conocimientos de los usuarios. Si bien sus estrategias de instrucción brindan claridad, la profundidad puede variar y responde a consultas concisas y elaboradas. La inclinación de Claude por la metadiscusión y el encuadre de perspectivas enfatiza la importancia más amplia de los conceptos, mejorando la experiencia de aprendizaje general.
3. Las respuestas de Bard se asemejan a un enfoque clásico de estrategias de instrucción , similar al estilo de un aula convencional. Centrándose en presentaciones objetivas y estructuradas, a menudo emplea el uso de analogías e ilustraciones comparativas para dilucidar conceptos. La personalización y el tacto agradable son evidentes, especialmente cuando se reconocen las aportaciones de los usuarios y se proporcionan conocimientos más profundos, fomentando el compromiso y la interactividad. Bard ocasionalmente integra metadiscusión y marcos de perspectiva para resaltar aplicaciones más amplias.
4. BingChat enfatiza la profundidad de los detalles y la recomendación de contenido al dirigir a los usuarios a recursos externos. Al adoptar un enfoque de refuerzo y retroalimentación más correccional, señala imprecisiones en las entradas de los usuarios, que a veces pueden eclipsar su personalización y toque personal. Si bien BingChat proporciona estrategias de instrucción estructuradas, su dependencia de enlaces externos podría disminuir el compromiso y la interactividad directos. Su uso de analogías e ilustraciones comparativas está presente, aunque menos pronunciado.
Esta clasificación se basa en el análisis presentado anteriormente. Proporciona una calificación comparativa para cada IA en diferentes categorías, pero la calificación específica puede ser subjetiva y variar según diferentes preguntas, contextos o incluso entre sesiones. La preferencia también puede ser subjetiva según los estilos y necesidades de aprendizaje individuales.
Al utilizar GenAIbots como herramientas educativas, los profesores pueden crear experiencias de aprendizaje más atractivas y personalizadas. Este enfoque podría potencialmente respaldar una comprensión más profunda de conceptos complejos en química y quizás en otras materias.
Este documento está disponible en arxiv bajo licencia CC BY-SA 4.0 DEED.