ai assessment edtech higher education learning design

AI 生成教育評量之可解釋性與認證框架研究

arXiv - Computers and SocietyAntoun Yaacoub, Zainab Assaghir, Anuradha Kar2026年4月14日

本文提出一套結合自我合理化與驗證機制的框架，旨在提升 AI 生成評量題目的透明度、認證能力與教學對齊度。

AI 幫你先抓重點

AI 重點 1

從「生成題目」轉向「生成證據」的範式轉移

滑鼠懸停看 AI 判斷理由

過去教育者關注 AI 能否產出題目，但本研究強調 AI 必須能解釋「為何這題符合特定認知層級」。這種從產出結果到產出解釋證據的轉變，是 AI 評量進入正式認證體系的關鍵。

AI 重點 2

建立標準化的認證元數據（Metadata）與工作流

滑鼠懸停看 AI 判斷理由

這解決了 AI 生成內容在教育機構中「不可信」的痛點。透過結構化的紀錄與紅綠燈審查機制，能讓 AI 輔助評量從實驗性質轉化為具備法律與制度合規性的正式教學工具。

核心研究發現

1
提出一個整合自我合理化、歸因分析與事後驗證的框架，能根據布魯姆（Bloom）與 SOLO 分類法提供具備認知對齊證據的解釋。
2
開發了一套結構化認證元數據架構，可記錄題目的來源、對齊預測、審查行動及倫理指標，以符合治理稽核需求。
3
透過「紅綠燈」認證工作流，有效區分出可自動認證的題目、需人工審查的題目以及應予拒絕的題目。
4
針對 500 題 AI 生成的電腦科學題目進行概念驗證，結果顯示該框架能提升透明度、減少教師工作量並增強稽核能力。

對教育工作者的啟發

對於教育工作者而言，未來使用 AI 輔助出題時，不應僅檢視題目內容是否正確，更應要求 AI 提供符合教學目標（如 Bloom 分類法）的解釋路徑。課程設計者可參考此框架，建立一套「AI 題目審查標準」，利用自動化工具進行初步篩選（綠燈），並將人力集中在處理複雜或具爭議性的題目（黃燈），從而實現大規模且高品質的個人化評量，同時確保教學品質與倫理合規。

原始文獻資訊

英文標題：: Explainability and Certification of AI-Generated Educational Assessments
作者：: Antoun Yaacoub, Zainab Assaghir, Anuradha Kar
來源：: arXiv - Computers and Society
AI 摘要模型：: /models/gemma-4-26B-A4B-it

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。