CODE-GEN:基於 RAG 與人機協作代理的程式選擇題生成系統

arXiv - Computers and SocietyXiaojing Duan, Frederick Nwanganga, Chaoli Wang

開發了一套結合 RAG 與雙代理架構的 AI 系統,透過人機協作生成高品質的程式邏輯理解選擇題。

AI 幫你先抓重點

AI 重點 1

採用「生成者-驗證者」雙代理架構(Agentic Architecture)來提升內容品質。

滑鼠懸停看 AI 判斷理由
這種架構模擬了教學設計中的審核流程,透過不同角色的 AI 進行自我檢核,能有效降低單一模型生成錯誤內容的風險,是未來自動化教材開發的重要趨勢。
AI 重點 2

區分 AI 的「計算能力」與人類的「教學判斷力」。

滑鼠懸停看 AI 判斷理由
研究明確指出 AI 擅長邏輯驗證,但人類在設計具備教學深度的干擾項時不可或缺。這能幫助開發者更精準地分配人力與算力,實現高效的人機協作模式。

核心研究發現

  1. 1

    CODE-GEN 系統在七個教學維度上的專家驗證成功率極高,介於 79.9% 至 98.6% 之間。

  2. 2

    AI 在題目清晰度、程式碼有效性、概念一致性及正確答案有效性等具備明確標準的維度上表現出高可靠性。

  3. 3

    在設計具備教學意義的干擾項(distractors)以及提供能強化理解的高品質回饋方面,仍需人類專家的深度判斷。

對教育工作者的啟發

教育工作者在利用 AI 生成評量時,應採取「混合式策略」:將程式碼正確性、概念對齊等可透過邏輯驗證的任務交給 AI 處理;而將重點放在設計「具備誤導性但具教學價值」的錯誤選項,以及撰寫能引導學生思考的解釋性回饋。透過這種分工,可以大幅提升教材產出的效率,同時確保教學品質不因自動化而下降。

原始文獻資訊

英文標題:
CODE-GEN: A Human-in-the-Loop RAG-Based Agentic AI System for Multiple-Choice Question Generation
作者:
Xiaojing Duan, Frederick Nwanganga, Chaoli Wang
來源:
arXiv - Computers and Society
AI 摘要模型:
/models/gemma-4-26B-A4B-it
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。