ai llm learning science capability elicitation post-training

後訓練階段：區分能力誘發與能力創造的自由能視角

arXiv - Artificial IntelligenceYuhao Li, Shengchao Liu2026年5月13日

本文提出以「可及支持集」區分模型能力的誘發與創造，並從自由能視角重新定義 SFT 與 RL 的本質。

AI 幫你先抓重點

AI 重點 1

重新定義後訓練（Post-training）的評估維度

滑鼠懸停看 AI 判斷理由

傳統觀點將 SFT 視為模仿、RL 視為發現，這過於粗糙。理解「誘發」與「創造」的差異，能幫助研究者判斷模型是真的學會了新技能，還是僅僅學會了如何更好地表現出舊有的潛力。

AI 重點 2

從「行為機率」轉向「行為空間」的思考方式

滑鼠懸停看 AI 判斷理由

這改變了我們對模型能力的認知。如果訓練只是在現有支持集內重新加權，那麼模型並未真正進化；只有當訓練能擴張「可及支持集」時，才算真正實現了能力的質變。

核心研究發現

1
提出「能力誘發」與「能力創造」的區別：前者是重新分配模型已具備行為的機率，後者則是擴張模型實際可達到的行為空間。
2
引入「可及支持集」（Accessible Support）概念，定義為模型在有限預算下實際能產出的行為集合，作為衡量能力變化的標準。
3
透過自由能視角分析，指出 SFT 與 RL 本質上都是對預訓練分佈進行重新加權，差異僅在於使用的外部信號不同。
4
強調後訓練的核心問題不在於使用 SFT 或 RL，而在於該過程是在重新分配現有行為，還是透過搜尋、工具使用或新資訊來擴張行為空間。

對教育工作者的啟發

對於開發 AI 教育工具的設計者而言，這提供了重要的啟發：在設計 AI 輔助學習系統時，應區分 AI 是在「誘發」學生已有的知識（例如透過提示引導學生說出答案），還是在「創造」新的學習路徑（例如透過引入新工具或資訊擴展學生的認知邊界）。在評估 AI 教學代理人（Tutor）的效能時，不應僅看其回答的準確度（誘發能力），更應關注其是否能引導學生進入原本無法觸及的更高階思考領域（創造能力）。

原始文獻資訊

英文標題：: On Distinguishing Capability Elicitation from Capability Creation in Post-Training: A Free-Energy Perspective
作者：: Yuhao Li, Shengchao Liu
來源：: arXiv - Artificial Intelligence
AI 摘要模型：: /models/gemma-4-26B-A4B-it

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。