簡介：大型語言模型中的即時自蒸餾

arXiv - Human-Computer InteractionFangming Cui, Sunan Li, Jiahong Li2026年5月22日

提出即時自蒸餾框架，讓同一模型同時作教師與學生，減少 GPU 40-60% 並解決離線蒸餾的分佈不匹配問題

AI 幫你先抓重點

AI 重點 1

模型同時扮演教師與學生，消除外部教師依賴，簡化訓練流程。

滑鼠懸停看 AI 判斷理由

這降低了模型蒸餾的複雜度與資源需求，使大模型的自蒸餾更易於實施與擴展。

AI 重點 2

OPSD 可將 GPU 記憶體使用量降低 40%–60%，使 LLM 能在較小硬體上部署。

滑鼠懸停看 AI 判斷理由

減少記憶體需求擴大了模型的可部署範圍，對教育科技產品的成本與可及性具有直接影響。

AI 重點 3

將學生推理行為與已驗證解答對齊，提升模型解釋性與可信度。

滑鼠懸停看 AI 判斷理由

對於需要透明推理的教育應用，這有助於教師與學生更好理解模型決策，增強信任與學習成效。

教育科技開發者可將 OPSD 應用於自動化教學系統，透過自蒸餾減少 GPU 成本並提升模型對解題邏輯的把握；研究者可利用此框架進行模型解釋與知識蒸餾，進一步優化教學內容；教師則可借助蒸餾後模型產生更符合解題邏輯的回饋，增進學生的自我調節與批判性思考。

英文標題：: A Brief Overview: On-Policy Self-Distillation In Large Language Models
作者：: Fangming Cui, Sunan Li, Jiahong Li
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: openai/gpt-oss-20b

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。