了解教師對大型語言模型生成回饋的修訂

arXiv - Computers and SocietyConrad Borchers, Luiz Rodrigues, Newarney Torrez\~ao da Costa, Cleon Xavier, Rafael Ferreira Mello

研究教師對LLM生成回饋的修訂行為,發現80%不改、編輯偏長、可用機器學習預測,且修訂往往簡化回饋。

AI 幫你先抓重點

AI 重點 1

教師80%不改LLM回饋,證明AI回饋已具備可直接使用價值。

滑鼠懸停看 AI 判斷理由
研究顯示大多數AI生成的回饋已足夠清晰且具備教育價值,教師不需額外修改,說明LLM在實務中的即時可用性與成本效益。
AI 重點 2

機器學習模型以AUC 0.75預測編輯需求,助教師快速定位需修訂回饋。

滑鼠懸停看 AI 判斷理由
模型僅依賴AI回饋文本即可預測編輯機率,提供自動化篩選工具,教師可將時間集中於高風險或高資訊的回饋,提升工作效率。

核心研究發現

  1. 1

    大約80%教師接受LLM回饋不做修改,僅在20%情況下進行編輯。

  2. 2

    編輯後的回饋文字長度顯著增加,教師往往在後續將其縮短。

  3. 3

    教師間編輯行為差異大,約50%教師從不編輯,僅10%教師編輯超過三分之二的回饋。

  4. 4

    以句子嵌入為特徵的機器學習模型能以AUC 0.75準確預測哪些回饋會被編輯。

  5. 5

    質性編碼顯示,編輯時教師傾向簡化回饋,將高資訊說明轉為簡潔的糾正性回饋。

對教育工作者的啟發

實務上,教師可先將LLM回饋直接呈現給學生,僅對高資訊說明進行簡化與重構,保持回饋簡潔且具糾正性。教育科技平台可嵌入機器學習模型,於教師編輯前自動標示可能需調整的回饋,節省編輯時間。課程設計者則可利用此研究結果,設計教師培訓模組,強調如何將AI回饋轉化為符合學習目標的簡明糾正訊息,並評估其對學生自我調節學習的影響。

原始文獻資訊

英文標題:
Understanding Teacher Revisions of Large Language Model-Generated Feedback
作者:
Conrad Borchers, Luiz Rodrigues, Newarney Torrez\~ao da Costa, Cleon Xavier, Rafael Ferreira Mello
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。