以存取時機作為支架:使用強化學習優化教育中的生成式 AI
arXiv - Computers and SocietyJanne Rotter, Pau Benazet i Montobbio, Davinia Hern\'andez-Leo
透過強化學習決定學生何時使用生成式 AI,可提升學習成效與元認知準確度,且不需額外提示,優於完全自由或完全限制使用。
AI 幫你先抓重點
AI 重點 1
存取時機本身即為隱式支架,能在不增加教師負擔的情況下提升學習成效。
滑鼠懸停看 AI 判斷理由
此洞察顯示時間控制可替代傳統明確提示,降低實務導入門檻,讓 AI 整合更具可擴展性。
AI 重點 2
RL 代理的獎勵函數結合元認知、認知負荷與失敗學習,證明跨理論設計能有效調節 AI 使用。
滑鼠懸停看 AI 判斷理由
此結果說明以理論為基礎的獎勵設計能引導 AI 行為,為未來人機學習系統提供設計藍圖。
核心研究發現
- 1
RL 控制的 GenAI 存取在後測成績與元認知準確度上優於完全自由使用,提升學習成效。
- 2
相較於完全限制,RL 條件下的任務錯誤率與耗時顯著降低,顯示時間控制能減輕工作負荷。
- 3
三種條件間在自報元認知覺知上無顯著差異,說明時間調節不影響主觀覺知。
對教育工作者的啟發
本研究提供一套可直接嵌入學習管理系統的強化學習框架,教師可透過設定獎勵函數(如元認知準確度、任務完成時間、錯誤率)來自動決定學生何時可存取生成式 AI。實務上,先在小規模課程中部署,收集學習成效與使用行為數據,逐步調整獎勵參數,確保 AI 介入既不過度依賴也不過度限制。由於不需要額外的提示或結構化支架,教師可在現有教學流程中低成本實施,並透過數據分析持續優化時間調節策略。
原始文獻資訊
- 英文標題:
- Access Timing as Scaffolding: A Reinforcement Learning Approach to GenAI in Education
- 作者:
- Janne Rotter, Pau Benazet i Montobbio, Davinia Hern\'andez-Leo
- 來源:
- arXiv - Computers and Society
- AI 摘要模型:
- openai/gpt-oss-20b
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。