AI 生成教育評量之可解釋性與認證框架研究
arXiv - Computers and SocietyAntoun Yaacoub, Zainab Assaghir, Anuradha Kar
本文提出一套結合自我合理化與驗證機制的框架,旨在提升 AI 生成評量題目的透明度、認證能力與教學對齊度。
AI 幫你先抓重點
AI 重點 1
從「生成題目」轉向「生成證據」的範式轉移
滑鼠懸停看 AI 判斷理由
過去教育者關注 AI 能否產出題目,但本研究強調 AI 必須能解釋「為何這題符合特定認知層級」。這種從產出結果到產出解釋證據的轉變,是 AI 評量進入正式認證體系的關鍵。
AI 重點 2
建立標準化的認證元數據(Metadata)與工作流
滑鼠懸停看 AI 判斷理由
這解決了 AI 生成內容在教育機構中「不可信」的痛點。透過結構化的紀錄與紅綠燈審查機制,能讓 AI 輔助評量從實驗性質轉化為具備法律與制度合規性的正式教學工具。
核心研究發現
- 1
提出一個整合自我合理化、歸因分析與事後驗證的框架,能根據布魯姆(Bloom)與 SOLO 分類法提供具備認知對齊證據的解釋。
- 2
開發了一套結構化認證元數據架構,可記錄題目的來源、對齊預測、審查行動及倫理指標,以符合治理稽核需求。
- 3
透過「紅綠燈」認證工作流,有效區分出可自動認證的題目、需人工審查的題目以及應予拒絕的題目。
- 4
針對 500 題 AI 生成的電腦科學題目進行概念驗證,結果顯示該框架能提升透明度、減少教師工作量並增強稽核能力。
對教育工作者的啟發
對於教育工作者而言,未來使用 AI 輔助出題時,不應僅檢視題目內容是否正確,更應要求 AI 提供符合教學目標(如 Bloom 分類法)的解釋路徑。課程設計者可參考此框架,建立一套「AI 題目審查標準」,利用自動化工具進行初步篩選(綠燈),並將人力集中在處理複雜或具爭議性的題目(黃燈),從而實現大規模且高品質的個人化評量,同時確保教學品質與倫理合規。
原始文獻資訊
- 英文標題:
- Explainability and Certification of AI-Generated Educational Assessments
- 作者:
- Antoun Yaacoub, Zainab Assaghir, Anuradha Kar
- 來源:
- arXiv - Computers and Society
- AI 摘要模型:
- /models/gemma-4-26B-A4B-it
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。