學習分析中的開放數據集:趨勢、挑戰與最佳實務

arXiv - Computers and SocietyValdemar \v{S}v\'abensk\'y, Brendan Flanagan, Erwin Daniel L\'opez Zapata, Atsushi Shimada

本研究透過大規模調查揭示學習分析領域開放數據集的現況,並提出名為 PRACTICE 的數據發佈指南。

AI 幫你先抓重點

AI 重點 1

數據透明度與研究可重複性的高度關聯性

滑鼠懸停看 AI 判斷理由
開放數據集不僅能提升研究的可重複性與信任度,還能增加作者的能見度與引用潛力。這對於推動學習分析從單純的實驗室研究轉向更具協作性的科學領域至關重要。
AI 重點 2

建立標準化數據發佈流程的必要性

滑鼠懸停看 AI 判斷理由
研究顯示現有的數據共享實務尚不明確,透過 PRACTICE 指南提供結構化的檢核機制,能降低研究者發佈數據的門檻,並確保數據在不同研究間的互操作性與品質。

核心研究發現

  1. 1

    研究人員手動檢視了過去五年內 LAK、EDM 與 AIED 三大頂尖會議的 1,125 篇論文,發現了 172 個數據集。

  2. 2

    在識別出的 172 個數據集中,有 143 個數據集是先前任何學習分析開放數據調查中未曾被記錄過的。

  3. 3

    研究詳細分類了數據集的背景、分析方法與用途,並識別出目前該領域在數據共享上的缺口。

  4. 4

    研究團隊開發了一套名為 PRACTICE 的八項指南與檢核表,旨在協助研究人員更有效地發佈數據。

對教育工作者的啟發

對於從事教育科技研究的人員,建議在發表研究成果時,應主動將去識別化後的數據集隨論文一同發佈。這不僅能提升研究的學術公信力,更能促進社群內的協作。建議參考文中提出的 PRACTICE 指南,建立標準化的數據說明文件(Metadata),確保數據的上下文背景(Context)與分析方法被完整記錄,以便後續研究者能正確引用並進行二次開發,從而加速學習科學領域的知識累積。

原始文獻資訊

英文標題:
Open Datasets in Learning Analytics: Trends, Challenges, and Best PRACTICE
作者:
Valdemar \v{S}v\'abensk\'y, Brendan Flanagan, Erwin Daniel L\'opez Zapata, Atsushi Shimada
來源:
arXiv - Computers and Society
AI 摘要模型:
/models/gemma-4-26B-A4B-it
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。