REC-CBM:評分規範導向的錯誤修正概念瓶頸模型

arXiv - Computers and SocietyChengshuai Zhao, Fan Zhang, Kumar Satvik Chaudhary, Yiwen Li, Lo Pang-Yun Ting, Ying-Chih Chen, Huan Liu

提出結合評分規範、序數校正與錯誤修正的概念瓶頸模型,提升開放式評分的準確性與可解釋性。

AI 幫你先抓重點

AI 重點 1

將評分規範嵌入概念編碼器,使模型能捕捉細粒度評分維度。

滑鼠懸停看 AI 判斷理由
此設計讓教師能在概念層面直接查看每個評分項目的得分與理由,提升評分過程的透明度與可操作性,進而增強對自動評分系統的信任。
AI 重點 2

序數對比校正保留評分尺度的秩序關係,避免傳統 CBM 的等距假設。

滑鼠懸停看 AI 判斷理由
保持分數排序正確對於需要精細分級的教育評估至關重要,能確保模型在不同等級之間的相對關係不被扭曲,提升評分的公平性與可靠性。

核心研究發現

  1. 1

    在三個公開開放式評分資料集上,REC-CBM 的平均評分準確度提升了 4.3% 至 6.1%,顯著優於現有最佳模型。

  2. 2

    模型在概念層面提供更真實的推理,概念預測的準確率提升 12% 以上,教師可直接檢視每個評分項目的解釋。

  3. 3

    消融實驗顯示評分規範編碼器、序數校正與錯誤修正模組各自貢獻顯著,缺失任一模組將導致評分準確度下降 2% 以上。

對教育工作者的啟發

教師可利用 REC‑CBM 產生的概念層解釋,快速定位學生答題弱點並針對性給予回饋;開發者可將模型嵌入線上評分平台,提供即時可解釋評分,並允許教師手動調整概念預測;政策制定者可參考模型的透明度與錯誤修正機制,推動評分公正性與標準化。

原始文獻資訊

英文標題:
REC-CBM: Rubric-Aware Error-Correction Concept Bottleneck Models for Trustworthy Open-Ended Grading
作者:
Chengshuai Zhao, Fan Zhang, Kumar Satvik Chaudhary, Yiwen Li, Lo Pang-Yun Ting, Ying-Chih Chen, Huan Liu
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。