AI 能成為教學夥伴?評估三大模型

arXiv - Computers and SocietyTalita de Paula Cypriano de Souza, Shruti Mehta, Matheus Arataque Uema, Luciano Bernardes de Paula, Seiji Isotani

比較 ChatGPT、Gemini、DeepSeek 在三種教學策略下的教學效能,發現 ChatGPT 與 Gemini 效果較佳,DeepSeek 效能較低。

AI 幫你先抓重點

AI 重點 1

蘇格拉底法下模型對提示敏感度差異

滑鼠懸停看 AI 判斷理由
文章指出此策略最能揭示模型差異,對設計教學對話至關重要。
AI 重點 2

ChatGPT 與 Gemini 在教學指標上高於 DeepSeek

滑鼠懸停看 AI 判斷理由
反映模型間教學效能差距,提醒教育者選擇合適模型。

核心研究發現

  1. 1

    在「範例」策略下,三模型互動模式相似,能提供具體程式碼示例。

  2. 2

    在「說明與類比」策略下,三模型亦表現相近,能以類比說明 C 語言概念。

  3. 3

    在「蘇格拉底法」策略下,模型對策略與初始提示更敏感,表現差異顯著。

  4. 4

    ChatGPT 與 Gemini 在所有評估指標上得分高於 DeepSeek,顯示模型間教學能力差異。

  5. 5

    評估協議顯示,模型在提供回饋與引導方面仍有提升空間,尤其在複雜問題上。

對教育工作者的啟發

此研究顯示,雖然 LLM 可作為教學助手,但其效能因模型與策略而異。對於課程設計者,建議先選擇 ChatGPT 或 Gemini,並針對蘇格拉底法調整提示語,以提升學生的批判性思考。教師可利用評估協議作為測試工具,評估不同模型在提供範例、說明與類比時的清晰度與相關性,進而調整教學內容。對於需要即時回饋的編程課程,建議結合模型生成的程式碼示例與人工審核,確保正確性與可理解性。

原始文獻資訊

英文標題:
Can AI be a Teaching Partner? Evaluating ChatGPT, Gemini, and DeepSeek across Three Teaching Strategies
作者:
Talita de Paula Cypriano de Souza, Shruti Mehta, Matheus Arataque Uema, Luciano Bernardes de Paula, Seiji Isotani
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。