ai edtech higher education metacognition assessment

為何有人問「為什麼」：人類與LLM的對照推理

arXiv - Human-Computer InteractionBritt Besch, Tobias Gerstenberg2026年5月8日

研究發現人們在回答為什麼問題時，會根據事後驚訝度推斷對照情境，並比較人類與LLM在此推理上的差異。

AI 幫你先抓重點

AI 重點 1

AI應重視事後驚訝度在對照推理中的核心作用，因其能揭示人類提問者的意圖。

滑鼠懸停看 AI 判斷理由

此洞察指出，對照推理不僅是語言理解，更是情境驚訝的反映，對設計問答系統或對話代理人能更精準捕捉用戶意圖。

AI 重點 2

AI需評估LLM對照選擇與期望判斷的一致性，以避免在教育對話中產生誤導性答案。

滑鼠懸停看 AI 判斷理由

若LLM對照選擇不符合其期望判斷，可能導致回答偏離用戶期望，影響學習者的信任與學習效果。

核心研究發現

1
研究顯示，對照選擇最佳由「事後期望」判斷預測，表明人們根據結果後的驚訝度推斷對照情境。
2
參與者在判斷先前期望、相似度與事後期望時，事後期望對對照選擇的解釋力最高。
3
大型語言模型在此任務中，雖能做出明確期望判斷，但其對照選擇與期望判斷之間的關聯不一致，顯示LLM對對照推理的局限。

對教育工作者的啟發

此研究指出，當學生在學習情境中被問及「為什麼」時，他們往往會根據結果後的驚訝感來推斷對照情境。教育工作者可利用此機制，設計先讓學生表達對事件的預期，再讓他們在事件發生後評估驚訝度，進而引導他們比較預期與實際，培養對照推理與元認知。對話式學習平台亦可加入事後驚訝度評估功能，協助LLM辨識學生的提問意圖，避免因對照選擇不一致而產生誤導性回答，提升學習者的信任與學習成效。

原始文獻資訊

英文標題：: Why Someone Asked "Why": Foil Inference in Human and LLM Question Interpretation
作者：: Britt Besch, Tobias Gerstenberg
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。