教導語言模型像學生一樣寫程式:用於學生模擬的對話式序列化方法

arXiv - Computers and SocietyCharles Koutcheme, Arto Hellas, Juho Leinonen

提出一種將學生程式開發過程轉化為對話格式的新方法,訓練出能精準模擬學生除錯行為的開源 AI 模型。

AI 幫你先抓重點

AI 重點 1

從「靜態程式碼」轉向「動態過程」的模擬範式

滑鼠懸停看 AI 判斷理由
傳統 AI 模擬多著重於最終結果,但此研究強調「過程」的重要性。透過模擬學生的錯誤與修正路徑,教育研究者能更有效地在低成本下測試教學策略與回饋機制。
AI 重點 2

利用開源模型解決教育數據隱私與成本問題

滑鼠懸停看 AI 判斷理由
過度依賴大型商業模型(如 GPT-4)會帶來隱私風險與高昂成本。此研究證明透過特定格式的數據訓練中小型開源模型(如 Qwen 4B/8B),即可達到極高的模擬精準度。

核心研究發現

  1. 1

    透過將學生的時間序列日誌轉化為「學生與評測系統」之間的對話格式,能有效捕捉程式開發中的迭代除錯過程。

  2. 2

    結合監督式微調(SFT)與偏好優化(Preference Optimization)的訓練流程,能使模型行為更貼近真實學生的除錯邏輯。

  3. 3

    實驗證明,加入環境回饋(如測試結果、錯誤訊息)的訓練方式,在功能對齊與程式碼相似度上優於僅使用程式碼的訓練法及大型語言模型提示法。

對教育工作者的啟發

對於開發自動化教學系統(ITS)的設計者,此研究提供了重要啟發:模擬學生的核心不在於模擬「正確答案」,而在於模擬「錯誤與修正的循環」。課程設計者在設計程式教學時,應特別關注環境回饋(如錯誤訊息)如何引導學生的除錯行為,因為這些回饋數據是訓練高品質教育 AI 的關鍵資產。此外,利用開源模型進行在地化或特定學科的學生行為模擬,將成為未來低成本、高隱私教學實驗的重要手段。

原始文獻資訊

英文標題:
Teaching Language Models How to Code Like Learners: Conversational Serialization for Student Simulation
作者:
Charles Koutcheme, Arto Hellas, Juho Leinonen
來源:
arXiv - Computers and Society
AI 摘要模型:
/models/gemma-4-26B-A4B-it
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。