後訓練階段:區分能力誘發與能力創造的自由能視角
arXiv - Artificial IntelligenceYuhao Li, Shengchao Liu
本文提出以「可及支持集」區分模型能力的誘發與創造,並從自由能視角重新定義 SFT 與 RL 的本質。
AI 幫你先抓重點
AI 重點 1
重新定義後訓練(Post-training)的評估維度
滑鼠懸停看 AI 判斷理由
傳統觀點將 SFT 視為模仿、RL 視為發現,這過於粗糙。理解「誘發」與「創造」的差異,能幫助研究者判斷模型是真的學會了新技能,還是僅僅學會了如何更好地表現出舊有的潛力。
AI 重點 2
從「行為機率」轉向「行為空間」的思考方式
滑鼠懸停看 AI 判斷理由
這改變了我們對模型能力的認知。如果訓練只是在現有支持集內重新加權,那麼模型並未真正進化;只有當訓練能擴張「可及支持集」時,才算真正實現了能力的質變。
核心研究發現
- 1
提出「能力誘發」與「能力創造」的區別:前者是重新分配模型已具備行為的機率,後者則是擴張模型實際可達到的行為空間。
- 2
引入「可及支持集」(Accessible Support)概念,定義為模型在有限預算下實際能產出的行為集合,作為衡量能力變化的標準。
- 3
透過自由能視角分析,指出 SFT 與 RL 本質上都是對預訓練分佈進行重新加權,差異僅在於使用的外部信號不同。
- 4
強調後訓練的核心問題不在於使用 SFT 或 RL,而在於該過程是在重新分配現有行為,還是透過搜尋、工具使用或新資訊來擴張行為空間。
對教育工作者的啟發
對於開發 AI 教育工具的設計者而言,這提供了重要的啟發:在設計 AI 輔助學習系統時,應區分 AI 是在「誘發」學生已有的知識(例如透過提示引導學生說出答案),還是在「創造」新的學習路徑(例如透過引入新工具或資訊擴展學生的認知邊界)。在評估 AI 教學代理人(Tutor)的效能時,不應僅看其回答的準確度(誘發能力),更應關注其是否能引導學生進入原本無法觸及的更高階思考領域(創造能力)。
原始文獻資訊
- 英文標題:
- On Distinguishing Capability Elicitation from Capability Creation in Post-Training: A Free-Energy Perspective
- 作者:
- Yuhao Li, Shengchao Liu
- 來源:
- arXiv - Artificial Intelligence
- AI 摘要模型:
- /models/gemma-4-26B-A4B-it
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。