AI 生成教育評量之可解釋性與認證框架研究

arXiv - Computers and SocietyAntoun Yaacoub, Zainab Assaghir, Anuradha Kar

本文提出一套結合自我合理化與驗證機制的框架,旨在提升 AI 生成評量題目的透明度、認證能力與教學對齊度。

AI 幫你先抓重點

AI 重點 1

從「生成題目」轉向「生成證據」的範式轉移

滑鼠懸停看 AI 判斷理由
過去教育者關注 AI 能否產出題目,但本研究強調 AI 必須能解釋「為何這題符合特定認知層級」。這種從產出結果到產出解釋證據的轉變,是 AI 評量進入正式認證體系的關鍵。
AI 重點 2

建立標準化的認證元數據(Metadata)與工作流

滑鼠懸停看 AI 判斷理由
這解決了 AI 生成內容在教育機構中「不可信」的痛點。透過結構化的紀錄與紅綠燈審查機制,能讓 AI 輔助評量從實驗性質轉化為具備法律與制度合規性的正式教學工具。

核心研究發現

  1. 1

    提出一個整合自我合理化、歸因分析與事後驗證的框架,能根據布魯姆(Bloom)與 SOLO 分類法提供具備認知對齊證據的解釋。

  2. 2

    開發了一套結構化認證元數據架構,可記錄題目的來源、對齊預測、審查行動及倫理指標,以符合治理稽核需求。

  3. 3

    透過「紅綠燈」認證工作流,有效區分出可自動認證的題目、需人工審查的題目以及應予拒絕的題目。

  4. 4

    針對 500 題 AI 生成的電腦科學題目進行概念驗證,結果顯示該框架能提升透明度、減少教師工作量並增強稽核能力。

對教育工作者的啟發

對於教育工作者而言,未來使用 AI 輔助出題時,不應僅檢視題目內容是否正確,更應要求 AI 提供符合教學目標(如 Bloom 分類法)的解釋路徑。課程設計者可參考此框架,建立一套「AI 題目審查標準」,利用自動化工具進行初步篩選(綠燈),並將人力集中在處理複雜或具爭議性的題目(黃燈),從而實現大規模且高品質的個人化評量,同時確保教學品質與倫理合規。

原始文獻資訊

英文標題:
Explainability and Certification of AI-Generated Educational Assessments
作者:
Antoun Yaacoub, Zainab Assaghir, Anuradha Kar
來源:
arXiv - Computers and Society
AI 摘要模型:
/models/gemma-4-26B-A4B-it
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。