後訓練階段:區分能力誘發與能力創造的自由能視角

arXiv - Artificial IntelligenceYuhao Li, Shengchao Liu

本文提出以「可及支持集」區分模型能力的誘發與創造,並從自由能視角重新定義 SFT 與 RL 的本質。

AI 幫你先抓重點

AI 重點 1

重新定義後訓練(Post-training)的評估維度

滑鼠懸停看 AI 判斷理由
傳統觀點將 SFT 視為模仿、RL 視為發現,這過於粗糙。理解「誘發」與「創造」的差異,能幫助研究者判斷模型是真的學會了新技能,還是僅僅學會了如何更好地表現出舊有的潛力。
AI 重點 2

從「行為機率」轉向「行為空間」的思考方式

滑鼠懸停看 AI 判斷理由
這改變了我們對模型能力的認知。如果訓練只是在現有支持集內重新加權,那麼模型並未真正進化;只有當訓練能擴張「可及支持集」時,才算真正實現了能力的質變。

核心研究發現

  1. 1

    提出「能力誘發」與「能力創造」的區別:前者是重新分配模型已具備行為的機率,後者則是擴張模型實際可達到的行為空間。

  2. 2

    引入「可及支持集」(Accessible Support)概念,定義為模型在有限預算下實際能產出的行為集合,作為衡量能力變化的標準。

  3. 3

    透過自由能視角分析,指出 SFT 與 RL 本質上都是對預訓練分佈進行重新加權,差異僅在於使用的外部信號不同。

  4. 4

    強調後訓練的核心問題不在於使用 SFT 或 RL,而在於該過程是在重新分配現有行為,還是透過搜尋、工具使用或新資訊來擴張行為空間。

對教育工作者的啟發

對於開發 AI 教育工具的設計者而言,這提供了重要的啟發:在設計 AI 輔助學習系統時,應區分 AI 是在「誘發」學生已有的知識(例如透過提示引導學生說出答案),還是在「創造」新的學習路徑(例如透過引入新工具或資訊擴展學生的認知邊界)。在評估 AI 教學代理人(Tutor)的效能時,不應僅看其回答的準確度(誘發能力),更應關注其是否能引導學生進入原本無法觸及的更高階思考領域(創造能力)。

原始文獻資訊

英文標題:
On Distinguishing Capability Elicitation from Capability Creation in Post-Training: A Free-Energy Perspective
作者:
Yuhao Li, Shengchao Liu
來源:
arXiv - Artificial Intelligence
AI 摘要模型:
/models/gemma-4-26B-A4B-it
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。