ai ai agents learning science representation edtech

身分作為吸引子：大型語言模型激活空間中持續性代理架構的幾何證據

arXiv - Artificial IntelligenceVladimir Vasilenko2026年4月15日

研究發現 LLM 的身分文件會在激活空間中形成「吸引子」幾何結構，使不同表述的身分資訊趨向一致的內部表示。

AI 幫你先抓重點

AI 重點 1

LLM 的「身分」具有穩定的幾何表徵特性

滑鼠懸停看 AI 判斷理由

這改變了我們對 LLM 僅是機率預測機的認知，暗示模型內部存在一種類似於認知核心的穩定狀態，這對於開發具備一致人格與長期目標的 AI 代理（AI Agents）至關重要。

AI 重點 2

語義一致性優於結構一致性

滑鼠懸停看 AI 判斷理由

這說明在設計 AI 角色或教學引導代理時，確保核心語義的穩定比單純模仿特定的指令格式更有效，能更精準地觸發模型預期的行為模式。

核心研究發現

1
實驗顯示 Llama 3.1 與 Gemma 2 模型中，身分文件的改寫版本（Paraphrases）在隱藏層狀態上比結構對照組更趨向緊密的集群。
2
統計數據顯示改寫版本與對照組的差異極其顯著（Cohen's d > 1.88, p < 10^-27），證明此現象具備跨架構的通用性。
3
消融實驗指出，此吸引子效應主要由語義驅動而非結構驅動，且結構完整性是達到吸引子區域的必要條件。
4
閱讀關於代理的身分描述會使模型內部狀態向吸引子移動，顯示「了解身分」與「扮演身分」在表示空間上有所區別。

對教育工作者的啟發

對於開發「AI 學習導師」或「數位學習夥伴」的設計者而言，此研究建議應著重於建立穩定且語義明確的「代理身分文件」。為了確保 AI 導師在長期互動中能維持一致的教學風格與角色定位，設計者不應僅依賴單次的 Prompt，而應構建一個語義豐富且結構完整的「核心身分描述」，利用模型內部的吸引子效應來維持其教學人格的穩定性，從而提供更具預測性與一致性的學習支持。

原始文獻資訊

英文標題：: Identity as Attractor: Geometric Evidence for Persistent Agent Architecture in LLM Activation Space
作者：: Vladimir Vasilenko
來源：: arXiv - Artificial Intelligence
AI 摘要模型：: /models/gemma-4-26B-A4B-it

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。