著者:
(1)レナート・P・ドス・サントス、CIAGE – 認知と教育における生成的人工知能センター。
この研究では、構成主義の観点から、化学教育の文脈におけるジェネレーティブ AI チャットボット (GenAIbots) (ChatGPT、Bing Chat、Bard、Claude) の比較優位性について掘り下げています。私たちの主な目的は、これら 4 つの AI ツールのうち、化学学習を強化するのに最も効果的なのはどれかを特定することでした。単一ケース スタディ アプローチを採用し、化学学習シミュレーション中に AI システムとシミュレートされた学生ペルソナ間のインタラクション ログを精査し、コンテンツ分析手法を取り入れて談話をさらに深く掘り下げました。私たちの調査結果は、これらのツールが「一緒に考えるエージェント」として、批判的思考、問題解決、理解、創造性、カスタマイズされた学習を強化する可能性を強調しています。特に注目すべきは、構成主義の原則に沿って、ソクラテスのような質問を通じて学習者を刺激する能力です。この研究では、GenAIbots から望ましい応答を引き出して反復的な考察を生み出すためのプロンプト作成の重要な役割を強調しています。また、これらのテクノロジーを教育現場に取り入れるためには、教育者に対する強力なトレーニングが必要であることも強調されています。結論として、ChatGPT、Bing Chat、Bard、Claude は、ダイナミックで包括的な学習体験を促進することで化学教育を充実させる準備ができていますが、ChatGPT が際立っており、Bing Chat のパフォーマンスを決定的に上回っています。Bard と Claude は僅差で後れを取りましたが、3 人ともより詳細で正確で微妙な理解を示しており、ChatGPT の文脈理解の巧みさを強調しています。
キーワード:化学教育、ChatGPT、Bing Chat、Bard、Claude、教育における人工知能、考えるエージェント
化学は科学教育の中心的な科目であり、物質の特性と変化を明らかにし、私たちの日常生活に決定的な影響を与えます (Dunlop et al., 2020)。しかし、化学は複雑でダイナミックな分野でもあり、基本的な概念と原理を深く理解する必要があります。そのため、学生にとって、現実の状況を抽象的な化学概念と関連付けることが困難な場合があります (Dewi et al., 2021)。化学教育の研究では、これらの学習の困難さを軽減するための効果的な戦略が模索されています (Permatasari et al., 2022; Timilsena et al., 2022; Tümay, 2016)。
Timilsenaら(2022)は、化学反応の抽象的な性質を理解する際の難しさや、不適切な教材やカリキュラムの複雑さなどの要因を特定し、効果的な教育戦略とツールの必要性を強調しました。Tümay(2016)は、学生が化学の基礎概念を理解するのに苦労していることを論じ、誤解や学習障害に対処することの重要性を強調しました。
Dewi et al. (2021) は、ジェネレーション Z の学生の化学教育の質を高めるために、批判的思考スキルとデジタル技術の統合の必要性を強調しました。Dunlop et al. (2020) は、学部化学専攻の学生が抱える課題に対処するために高等教育に哲学的対話を導入することを提案し、それが新しい考え方を刺激できると示唆しました。
2023年、カストロ・ナシメントとピメンテルは、化学のさまざまな分野にわたる5つの異なるタスクにChatGPTモデルを応答させることで、その熟練度を評価する研究に着手しました(Castro Nascimento&Pimentel、2023)。これらのタスクには、化合物名をSMILES化学表現に変換すること(およびその逆)、化合物のオクタノール-水分配係数に関する情報を入手すること、配位化合物の構造情報を抽出すること、ポリマーの水溶性を決定すること、および単純な分子化合物の分子点群を特定することが含まれていました。満足のいく結果が得られなかったため、モデルがこれらの特定の化学関連のクエリに適切に対処する能力に潜在的な限界があることが浮き彫りになりました。特に、観察された最適ではないパフォーマンスは、ChatGPTの古いバージョン、具体的には2020年にOpenAIによって導入されたGPT-3モデル(Brown et al.、2020)を使用していることに起因している可能性があります。
同年に実施された別の研究で、レオンとヴィダニ(2023)は、大学レベルの化学入門コースの枠組み内でChatGPTの回答の信頼性を調査しました。彼らの調査結果は、ChatGPTが37%を超えるスコアを確保できなかったため、信頼性に重大な懸念があることを示しました。このようなパフォーマンスは、学習支援のためにこのツールに頼っている学習者は主に誤った回答を受け取り、ツールの変動性により個々の学習者の回答が異なることを意味しています。著者は研究でどのバージョンのChatGPTを利用したかを特定していませんが、「ChatGPTの無料のオリジナルバージョン」への言及と、FloridiとChiriatti(2020)のChatGPT-3に関する研究の引用は、このバージョンを使用した可能性を示唆しています。
さらに、ピメンテルら (2023) は、化学の 6 つのトピックにまたがる複雑な質問に回答する際の ChatGPT バージョン 3 と 4 の有効性を詳しく調べました。両バージョンとも複雑なトピックのニュアンスに対応するには現時点では不十分であると結論付けましたが、ChatGPT-3 から ChatGPT-4 にかけて注目すべき進歩も観察しました。このような進歩は、このツールが将来の文献レビュー、調査、教育活動において科学者を支援する有望な可能性を示しています。
ChatGPT、Bing Chat、Bard、Claude などの生成型 AI 搭載チャットボット (GenAIbots) は、化学教育における永続的な課題に対する革新的なソリューションとして導入されてきました (Baidoo-Anu & Owusu Ansah、2023 年、Taylor 他、2022 年)。これらの登場により、ダイナミックで包括的な教育環境が提供され、複雑な概念の伝達と理解の方法が変革されました。これらの GenAIbots は、複雑なトピックを簡素化し、自己反省を促進し、ユーザーを刺激的な対話に引き込み、パーソナライズされた学習を促進し、批判的思考、コラボレーション、認知発達を強化します (Okonkwo & Ade-Ibijola、2021 年)。その結果、化学教育に革命を起こす上で極めて重要な役割を果たしました。
エージェンシーに関する議論では、アンスコムやデイビッドソンの理論などの伝統的な理論では、欲望、信念、意図を含む表象的な精神状態に基づいて、エンティティにアクションを帰属させています。しかし、ハイダーとシメル、デネット、デイビッドソン、バランディアランらの研究を参考にした代替の視点は、この表象依存の見解に異議を唱え、そのような精神的表象がなくても潜在的なエージェンシーが存在することを示唆しています (Schlosser、2019)。これらのフレームワーク内で GenAIbots を検討する場合、トレーニングに基づいて応答するエンティティの能力は、エージェンシーの中心的な特性である自己認識、意図、および積極的な行動の欠如と対照的です。その結果、支配的な哲学的および認知的モデルは ChatGPT にエージェンシーを付与しませんが、これらの引用された思想家によって提供されるより広範な解釈はそれを受け入れる可能性があります。
この基盤を基に、メラニー・スワンの提案に触発されて、私たちはパパート (1980) の「考えるためのオブジェクト」という概念を拡張し、「考えるためのエージェント」を導入しました。これにより、GenAIbots は教育の道に不可欠な参加者として位置付けられ、タークル (1984) の「メタ認知マシン」という概念を反映しています。つまり、GenAIbots は、フラベル (1976) が説明した「考えることについて考える」という、自分自身の認知プロセスに対する認識を高めるのに役立ちます。ラトゥール (1991) の観点では、GenAIbots は人間と非人間的存在の境界を曖昧にする「ハイブリッド」として捉えることができます。このような観点は、拡張された人間と AI が協力し、共生して繁栄するというスワン (2015) の未来のビジョンとも一致しています。
GenAIbots は、批判的思考、問題解決、概念の深い理解を促進する強力なメタ認知教育ツールであると位置づけられていますが、その限界を認識することが不可欠です。たとえば、OpenAI (2023) が強調したように、無意味または不正確なコンテンツが生成される可能性もあります。とはいえ、即時のフィードバックを提供し、多様な視点を導入し、複雑なアイデアとのインタラクティブな関わりを促進する GenAIbots の独自の能力は、化学教育の分野で影響力のある思考エージェントとしての地位を固めています。
この論文は、CC BY-SA 4.0 DEED ライセンスの下でarxiv で公開されています。