ai edtech assessment higher education learning design

缺失的評估軸：10,000 場學生提交揭示 AI 教師效能

arXiv - Computers and SocietyRose Niousha, Samantha Boatright Smith, Bita Akram, Peter Brusilovsky, Arto Hellas, Juho Leinonen, John DeNero, Narges Norouzi2026年5月8日

提出以學生行為為基礎的 AI 教師評估框架，發現行為指標比單純教學質量更能預測學生對回饋的感知。

AI 幫你先抓重點

AI 重點 1

行為維度是評估 AI 教師效能的關鍵缺口

滑鼠懸停看 AI 判斷理由

它捕捉學生實際採取回饋的行為，彌補僅評估回饋教學質量所忽略的學習成效連結，讓開發者能針對可操作性做優化。

AI 重點 2

行為指標與學生感知回饋有用性之關聯度高於教學質量

滑鼠懸停看 AI 判斷理由

此洞察顯示評估需結合學生互動數據，將焦點從單純教學設計轉向數據驅動的互動分析，進而提升回饋的實際效用。

核心研究發現

1
在 10,235 場提交中，能量化學生是否採取 AI 回饋並正確執行的行為指標。
2
兩個 AI 教師在不同學期的比較顯示學生互動模式差異顯著，且這些差異未被單純教學質量評估捕捉。
3
行為指標與學生對回饋有用性的感知關聯度高於教學質量，提供更完整可行的 AI 教師效能畫面。

對教育工作者的啟發

1) 在設計 AI 回饋時加入可操作性提示，鼓勵學生立即修正。2) 透過學習管理系統收集學生行為數據，評估回饋是否被採納。3) 以行為指標作為迭代優化指標，補充教學質量評估。4) 針對不同學期或學生群體調整 AI 回饋策略，以提升互動與學習成效。

原始文獻資訊

英文標題：: The Missing Evaluation Axis: What 10,000 Student Submissions Reveal About AI Tutor Effectiveness
作者：: Rose Niousha, Samantha Boatright Smith, Bita Akram, Peter Brusilovsky, Arto Hellas, Juho Leinonen, John DeNero, Narges Norouzi
來源：: arXiv - Computers and Society
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。