ai assessment learning analytics edtech knowledge building

人類與 AI 協作優化 Q-矩陣框架：基於 NeuralCDM 的評估研究

arXiv - Computers and SocietyYing Zhang, Ningxi Cheng, Yizhu Gao, Hongmei Li, Lehong Shi, Nicholas Young, Geng Yuan, Xiaoming Zhai2026年4月21日

提出結合 LLM 生成與 NeuralCDM 實證評估的框架，能有效自動化並優化用於學習分析的 Q-矩陣。

AI 幫你先抓重點

AI 重點 1

從「人工撰寫」轉向「AI 生成與實證驗證」的評估範式轉移。

滑鼠懸停看 AI 判斷理由

傳統 Q-矩陣依賴專家經驗，耗時且具主觀性；此研究證明 AI 能透過數據回饋進行自我修正，大幅提升知識組件建模的效率與精準度。

AI 重點 2

隱私保護與模型效能之間的平衡點已初步達成。

滑鼠懸停看 AI 判斷理由

對於教育機構而言，數據隱私是導入 AI 的最大障礙。研究顯示本地部署模型不失效能，這意味著教育者可以在不犧牲數據安全的前提下，利用先進 AI 進行學習分析。

核心研究發現

1
透過結構化且具備誤解感知能力的提示詞，LLM 能生成具備潛力的 Q-矩陣候選方案。
2
經迭代優化的 LLM 生成矩陣在熱力學評估數據上的表現（AUC 0.780）優於專家基準模型（AUC 0.717）。
3
本地部署的 LLM 在效能上可與雲端 API 媲美，這為保護學生數據隱私提供了可行路徑。

對教育工作者的啟發

課程設計者與評估專家可利用此框架將繁瑣的知識點映射（Q-matrix construction）自動化。建議在設計數位化評量系統時，不應僅依賴專家直覺，而應引入類似 NeuralCDM 的數據驅動機制來驗證知識點與題目之間的關聯性。此外，對於重視學生隱私的教育機構，應優先考慮部署本地化的大語言模型，以在確保數據安全性的同時，獲得與雲端模型相當的自動化評量優化能力。

原始文獻資訊

英文標題：: A Framework for Human-AI Q-Matrix Refinement: A NeuralCDM Evaluation
作者：: Ying Zhang, Ningxi Cheng, Yizhu Gao, Hongmei Li, Lehong Shi, Nicholas Young, Geng Yuan, Xiaoming Zhai
來源：: arXiv - Computers and Society
AI 摘要模型：: /models/gemma-4-26B-A4B-it

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。