在生成式 AI 時代重新構想評量:ChatGPT 開放式考試的啟示

arXiv - Computers and SocietyQusay H. Mahmoud

研究顯示,允許學生使用 ChatGPT 的開放式考試能揭示其推理與驗證能力,提示評量應聚焦於思考過程而非單純答案正確性。

AI 幫你先抓重點

AI 重點 1

評量應聚焦於學生的推理與驗證過程,而非僅僅檢視答案正確性。

滑鼠懸停看 AI 判斷理由
因為 AI 使答案可輕易生成,真正的學習在於學生如何評估與修正 AI 產出,這揭示了更深層的理解與專業實踐能力。
AI 重點 2

透明允許 AI 使用可減少規則迴避,提升自我調控與學習策略的運用。

滑鼠懸停看 AI 判斷理由
允許 AI 並要求提交對話紀錄,促使學生更主動地監控與調整學習行為,對於設計 AI 介入的評量策略具有重要參考價值。

核心研究發現

  1. 1

    學生在考試中使用 ChatGPT 時,呈現三種使用模式:答案檢索、引導協作與批判驗證,並逐步提升提示迭代與結果測試。

  2. 2

    最具說服力的推理證據來自於學生對 AI 產出不完整或錯誤答案的評估,透過除錯、比較與說明展現評估思考。

  3. 3

    生成式 AI 的介入將評量焦點從產出解答轉向評估解答有效性,促使正確答案不再是唯一的學習證據。

對教育工作者的啟發

對於高等教育的課程設計者與評量專家而言,本文提供了將 AI 介入納入評量的實務路徑。首先,考試設計可明確要求學生提交 AI 互動紀錄,藉此捕捉其提示設計、迭代與驗證行為,並以此為評分標準。其次,評量重點應從「答案正確」轉向「解答有效性評估」與「思考過程透明度」,例如加入對 AI 產出錯誤的除錯與比較題目。再次,透過透明允許 AI 使用,可降低學生對規則迴避的焦慮,促進自我調控與學習策略的實踐。最後,教育者可利用此模式培養學生的批判性思維與專業判斷力,進一步提升其在實務環境中的應用能力。

原始文獻資訊

英文標題:
Reimagining Assessment in the Age of Generative AI: Lessons from Open-Book Exams with ChatGPT
作者:
Qusay H. Mahmoud
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。