著者:
(1)レナート・P・ドス・サントス、CIAGE – 認知と教育における生成的人工知能センター。
この研究の調査結果は、ソクラテス式対話によって誤りや矛盾を修正したにもかかわらず、ChatGPT は物理学の家庭教師として機能するために必要な基準を満たしていないと主張した Gregorcic と Pendrill (2023) の調査結果とは異なっています。この相違は、ChatGPT の古くてあまり進歩していないバージョン、具体的には 2020 年に OpenAI によって導入された GPT-3 モデル (Brown ら、2020) を使用していることに起因している可能性があります。
私たちの研究によると、ChatGPT、Bing Chat、Bard、Claude の現在のバージョンは、Papert のコンセプト (1980、p. 11) に従って、効果的な思考対象として機能し、魅力的でインタラクティブかつ包括的な学習環境を育むことができます。これらの AI ツールは、創造性、コラボレーション、探索、批判的思考、問題解決をサポートし、主題の理解を深める可能性があります。これは、Liu ら (2023) の研究における ChatGPT、Bard、Bing Chat の比較に関連しています。
GenAIbots が一緒に考えるエージェントとして機能したこの教育の旅の全体的な成功は、関連する概念の深い理解を促進できるいくつかの効果的な教育戦略を浮き彫りにしています。プロセスの重要な部分は肯定的な強化であり、GenAIbots は学生の観察を楽しいものとして認め、彼らの経験を検証し、彼らの好奇心を刺激しました。さらに、Gregorcic と Pendrill (2023) に倣って、ソクラテスのような対話戦略を採用し、単に答えを提供するのではなく、学生が批判的に考え、積極的に学習に参加するよう促しました。GenAIbots はまた、重さや重力などのトピックに対する理解について質問することで学生の既存の知識を活用し、新しい情報と以前に学習した情報の間に意味のある橋渡しを確立しました。
Bitzenbauerの予備研究(2023)では、ChatGPTを含む拡張言語モデルベースのチャットボットが学習体験を豊かにする可能性を強調し、Adiguzelら(2023)は、パーソナライズされた指導とリアルタイムのフィードバックを介した教育におけるChatGPTの変革の可能性を主張しましたが、この研究は、学習環境へのAI統合の利点を強調しています。ChatGPT、Bing Chat、Bard、ClaudeなどのAI駆動型チャットボットやその他の生成モデルは、困難な学習シナリオに対処し、学生の知識を段階的に拡大し、学習をサポートするための関連する説明、例、類推を提供する高度なエージェントとして機能する可能性があります。この研究は、化学における能動的な学習、パーソナライズされた指導、概念理解を促進するAI駆動型ツールの可能性を強調しています。教育体験を向上させるAIの価値を強調し、GenAIbotsは困難な教育シナリオを探索するための革新的なプラットフォームとして機能できると結論付けています。
それにもかかわらず、私たちの分析では、ChatGPT と Claude は、短く情報量の少ない回答をする傾向があった Bing Chat よりも、一貫して包括的で詳細かつ正確な回答を提供していることが明らかになりました。ChatGPT-4 は、学生の質問に回答を適応させ、誤解に対処し、カスタマイズされた説明を提供することができました。また、ChatGPT は、質問のニュアンスや微妙な点に対処し、文脈を認識し、ユーザーの独自の視点や解釈に取り組むことに長けていました。一方、Bing Chat はこれらのニュアンスに対処できないことが多く、文脈情報もあまり提供していませんでした。全体的に、ChatGPT と Claude は、主題に対する優れた理解と、複雑な科学的概念をわかりやすい方法で伝える優れた能力を示しました。
この研究では、これらのツールを教室に導入する前に、包括的な教育者トレーニングが必要であることも強調されました。適切なトレーニングにより、教師は生徒が自分の考えを明確に表現し、確固とした議論を構築できるように効果的に指導できるようになります。この準備により、教育者は説得力のある反例に直面したときの GenAIbots のパフォーマンスを評価でき、同僚間で生産的な議論を促進できます。
最後に、この実験の結果、ChatGPT、Bing Chat、Bard、Claude のパフォーマンスに大きなばらつきがあることが明らかになったことを言及することが重要です。この結果は Franciscu (2023) と一致しており、最先端の自然言語生成モデルである ChatGPT は、チャットボットに適した人間のような応答を生成するのに優れています。上記の詳細な分析に基づくと、いくつかの基本的な類似点があるにもかかわらず、ChatGPT は BingChat を著しく上回り、Bard と Claude は ChatGPT のパフォーマンスに密接に追随し、以下に説明し、表 2 にまとめているように、両者の熟練度レベルは同等でした。
1. ChatGPT は、肯定的な強化とフィードバックのメカニズムを通じて、一貫したパーソナライゼーションとパーソナルなタッチを実現しています。効果的な指導戦略を採用し、説明を体系的に分解することが多く、フィードバックを求めることでエンゲージメントとインタラクティブ性でユーザーを頻繁に引き込みます。類推と比較の図解を巧みに使用して、 ChatGPT は抽象的な概念をわかりやすいシナリオに変換します。その詳細の深さとコンテンツの推奨はカスタマイズされており、包括的であり、より広いコンテキストを提供するために、メタディスカッションと視点のフレーミングに踏み込むこともあります。
2. Claude の強みは、主にパーソナライゼーションとパーソナルタッチ、エンゲージメントとインタラクティブ性にあり、学習をインタラクティブな対話のように感じさせます。わかりやすい説明を提供し、特にユーザーの洞察に基づいて構築する際には、アナロジーや比較図解の使用に大きく依存しています。指導戦略は明快さを提供しますが、深さはさまざまであり、簡潔で詳細な質問に対応できます。Claudeのメタディスカッションと視点のフレーミングへのこだわりは、概念のより広い重要性を強調し、全体的な学習体験を向上させます。
3.バード氏の回答は、従来の教室スタイルに似た、古典的な指導戦略アプローチに似ています。事実に基づいた構造化されたプレゼンテーションに重点を置き、概念を解明するためにアナロジーや比較図解の使用を頻繁に採用しています。パーソナライゼーションとパーソナルタッチは、特にユーザーの入力を認識し、より深い洞察を提供し、エンゲージメントとインタラクティブ性を促進するときに顕著です。バード氏は、より幅広い応用を強調するために、メタディスカッションと視点のフレーミングを時折統合しています。
4. BingChat は、ユーザーを外部リソースに誘導することで、詳細の深さとコンテンツの推奨を強調しています。より矯正的な強化とフィードバックのアプローチを採用し、ユーザー入力の不正確さを指摘しますが、これはパーソナライゼーションと人間味のあるタッチを覆い隠すことがあります。BingChatは構造化された指導戦略を提供しますが、外部リンクに依存しているため、直接的なエンゲージメントとインタラクティブ性が低下する可能性があります。類推と比較イラストの使用はありますが、それほど顕著ではありません。
このランキングは、先に紹介した分析に基づいています。さまざまなカテゴリにわたって各 AI の比較評価を提供しますが、具体的な評価は主観的である可能性があり、質問やコンテキスト、さらにはセッションによっても異なる場合があります。好みも、個人の学習スタイルやニーズに応じて主観的になる可能性があります。
GenAIbots を教育ツールとして使用することで、教師はより魅力的でパーソナライズされた学習体験を生み出すことができます。このアプローチは、化学やその他の科目の複雑な概念をより深く理解することをサポートする可能性があります。
この論文は、CC BY-SA 4.0 DEED ライセンスの下でarxiv で公開されています。