缺失的評估軸:10,000 場學生提交揭示 AI 教師效能

arXiv - Computers and SocietyRose Niousha, Samantha Boatright Smith, Bita Akram, Peter Brusilovsky, Arto Hellas, Juho Leinonen, John DeNero, Narges Norouzi

提出以學生行為為基礎的 AI 教師評估框架,發現行為指標比單純教學質量更能預測學生對回饋的感知。

AI 幫你先抓重點

AI 重點 1

行為維度是評估 AI 教師效能的關鍵缺口

滑鼠懸停看 AI 判斷理由
它捕捉學生實際採取回饋的行為,彌補僅評估回饋教學質量所忽略的學習成效連結,讓開發者能針對可操作性做優化。
AI 重點 2

行為指標與學生感知回饋有用性之關聯度高於教學質量

滑鼠懸停看 AI 判斷理由
此洞察顯示評估需結合學生互動數據,將焦點從單純教學設計轉向數據驅動的互動分析,進而提升回饋的實際效用。

核心研究發現

  1. 1

    在 10,235 場提交中,能量化學生是否採取 AI 回饋並正確執行的行為指標。

  2. 2

    兩個 AI 教師在不同學期的比較顯示學生互動模式差異顯著,且這些差異未被單純教學質量評估捕捉。

  3. 3

    行為指標與學生對回饋有用性的感知關聯度高於教學質量,提供更完整可行的 AI 教師效能畫面。

對教育工作者的啟發

1) 在設計 AI 回饋時加入可操作性提示,鼓勵學生立即修正。2) 透過學習管理系統收集學生行為數據,評估回饋是否被採納。3) 以行為指標作為迭代優化指標,補充教學質量評估。4) 針對不同學期或學生群體調整 AI 回饋策略,以提升互動與學習成效。

原始文獻資訊

英文標題:
The Missing Evaluation Axis: What 10,000 Student Submissions Reveal About AI Tutor Effectiveness
作者:
Rose Niousha, Samantha Boatright Smith, Bita Akram, Peter Brusilovsky, Arto Hellas, Juho Leinonen, John DeNero, Narges Norouzi
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。