ai edtech knowledge building assessment learning design

MedThink：教師引導推理修正提升小型模型診斷準確度

arXiv - Computers and SocietyXinchun Su, Chunxu Luo, Lipeng Ma, Yixuan Li, Weidong Yang2026年5月12日

提出兩階段教師引導蒸餾框架 MedThink，透過推理修正提升小型語言模型在醫學診斷上的準確度與泛化能力。

AI 幫你先抓重點

AI 重點 1

教師引導的推理修正能在小型模型中重建結構化診斷思維，突破傳統蒸餾僅傳遞答案模式的限制。

滑鼠懸停看 AI 判斷理由

此洞察說明小型模型若透過教師生成推理鏈，可重現大型模型的結構化推理，從而在資源受限環境下仍保持高準確度，對於設計高效醫學 AI 具有重要指導意義。

AI 重點 2

兩階段迭代蒸餾可在保持計算效率的同時，顯著提升模型在專業醫學領域的泛化表現。

滑鼠懸停看 AI 判斷理由

此觀點揭示了在資源受限場景下，透過教師評估與推理修正的迭代，可兼顧效能與準確度，為實務應用提供可行的平衡策略。

核心研究發現

1
MedThink 在一般醫學基準上比六種蒸餾策略提升最高 12.7% 的準確度。
2
在胃腸病學 955 題對資料集上，MedThink 的最高準確率達 56.4%。
3
兩階段蒸餾過程中，教師先提供領域知識解釋再評估學生錯誤並生成推理鏈，顯著改善診斷推理。

對教育工作者的啟發

對於想在資源有限環境部署醫學 AI 的實務工作者，MedThink 示範了教師引導推理蒸餾的可行性。首先，在模型訓練前先用大型模型篩選高質量案例並加入領域知識說明，建立知識基礎；其次，將學生模型的錯誤回饋給教師，讓教師生成連結知識與正確答案的推理鏈，並以此為指導進行第二輪微調。這種兩階段迭代流程不僅提升診斷準確度，還能保持模型體積小、推理速度快，適合部署於醫院資訊系統或移動端。設計師可將此流程納入醫學教育模組，讓學習者在小模型上練習推理，並透過教師回饋加強元認知。

原始文獻資訊

英文標題：: MedThink: Enhancing Diagnostic Accuracy in Small Models via Teacher-Guided Reasoning Correction
作者：: Xinchun Su, Chunxu Luo, Lipeng Ma, Yixuan Li, Weidong Yang
來源：: arXiv - Computers and Society
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。