模擬學生還是奉承式解題？LLM 模擬器的誤解忠實度

arXiv - Computers and SocietyHeejin Do, Shashank Sonkar, Mrinmaya Sachan2026年5月14日

提出評估LLM模擬學生誤解忠實度的框架，發現現有模型無差異回應，並透過SFT+RL提升誤解一致性

AI 幫你先抓重點

AI 重點 1

誤解忠實度評估框架揭示LLM缺乏針對性學習，提示需從靜態輸出轉向互動式信念建模。

滑鼠懸停看 AI 判斷理由

此洞察指出目前的評估指標不足以捕捉模型的誤解更新行為，強調互動式、信念驅動的模擬設計對於提升AI導師真實度的重要性。

AI 重點 2

SFS對應的後訓練策略（SFT+RL）能顯著提升模型對誤解的保持與更新，為實務上可落實的改進路徑。

滑鼠懸停看 AI 判斷理由

展示了一套可操作的訓練流程，能在現有LLM上直接提升誤解忠實度，對教育科技開發者與研究者提供具體可落實的技術指引。

1
研究發現七種LLM在「誤解忠實度」測試中，Selective Flip Score (SFS) 接近零，表示模型在不同類型回饋下修正答案的頻率相同，缺乏針對性誤解更新。
2
分析顯示LLM表現為「奉承式解題」失效模式：任何糾正訊號都被視為重新解題的機會，模型忽略原有誤解信念。
3
透過後訓練管道（SFT + preference optimization + SFS-aligned RL），SFS可提升至+0.56，且RL相較於偏好優化提供更穩定的改進。

教育工作者可利用SFS評估工具檢視模擬學生的誤解更新；在設計AI導師時加入SFT+RL後訓練，強化模型對針對性回饋的敏感度；同時在課堂中引入互動式回饋，促進學生自我修正。

英文標題：: Simulating Students or Sycophantic Problem Solving? On Misconception Faithfulness of LLM Simulators
作者：: Heejin Do, Shashank Sonkar, Mrinmaya Sachan
來源：: arXiv - Computers and Society
AI 摘要模型：: openai/gpt-oss-20b

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。