RoMathExam:跨越百年的羅馬尼亞數學考試縱向數據集研究

arXiv - Computers and SocietyLuca-Ncolae Cuclea, Sabin-Codrut Badea, Adrian-Marius Dumitran

本文推出包含逾萬題羅馬尼亞數學題的長時段數據集,並提出一套可量化題目複雜度的指標。

AI 幫你先抓重點

AI 重點 1

利用 AI 模型驗證題目複雜度的有效性

滑鼠懸停看 AI 判斷理由
在缺乏歷史心理計量數據的情況下,利用前沿 LLM(如 GPT-5-mini, DeepSeek-R1)來驗證複雜度指標,為低資源語言的教育評量研究提供了一種可擴展且具備科學性的新路徑。
AI 重點 2

數據集結構化對於課程演變分析的重要性

滑鼠懸停看 AI 判斷理由
透過標準化的 JSON 格式與主題標籤,研究者不僅能進行 AI 評量,更能從宏觀角度觀察教學大綱與課程內容隨時間變遷的規律,這對課程設計具有深遠意義。

核心研究發現

  1. 1

    建立了一個包含 1895 年至 2025 年間、共 10,592 道數學題目的縱向數據集,涵蓋 600 多套完整的考試卷宗。

  2. 2

    開發出一種「解題複雜度指標」作為難度的代理變數,經大型語言模型驗證,其跨模型同步率高於 0.72。

  3. 3

    透過縱向分析發現,羅馬尼亞數學課程經歷了從多變的歷史格式轉向標準化、以代數為核心的現代課程轉型。

對教育工作者的啟發

對於課程設計者而言,此研究展示了如何利用長時段的評量數據來追蹤教學目標的演進。實務上,教育工作者可以參考這種「複雜度指標」的概念,在缺乏標準化測驗數據時,嘗試利用 AI 工具來輔助評估教材或考題的難度層次。此外,對於開發教育 AI 的團隊,建立具備主題標籤與溯源性的結構化數據集,是提升 AI 評量精準度與減少生成雜訊的關鍵基礎。

原始文獻資訊

英文標題:
RoMathExam: A Longitudinal Dataset of Romanian Math Exams (1895-2025) with a Seven-Decade Core (1957-2025)
作者:
Luca-Ncolae Cuclea, Sabin-Codrut Badea, Adrian-Marius Dumitran
來源:
arXiv - Computers and Society
AI 摘要模型:
/models/gemma-4-26B-A4B-it
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。