實際資本下的鏈上語言模型代理操作層控制
arXiv - Artificial IntelligenceT. J. Barton, Chris Constantakis, Patti Hauseman, Annie Mous, Alaska Hoffman, Brian Bergeron, Hunter Goodreau
研究在實際資本環境下,語言模型代理的可靠性如何透過操作層控制提升。
AI 幫你先抓重點
AI 重點 1
操作層控制是提升鏈上語言模型代理可靠性的關鍵
滑鼠懸停看 AI 判斷理由
因為可靠性源於系統級安全機制,而非單純模型,提示設計者需重視操作層的完整性與可觀測性,以確保實際交易安全。
AI 重點 2
針對性測試能顯著降低偽造規則與手續費失效,提升資本部署率
滑鼠懸停看 AI 判斷理由
展示了嚴謹的前置測試與針對性改進能大幅提升真實環境表現,為實務開發者提供可落地的測試與優化策略。
核心研究發現
- 1
3,505 代理於 21 天內交易實際 ETH,產生 7.5M 調用、300K 鏈上行為、$20M 交易量、5,000 ETH 部署、70B 推理 token、99.9% 成交成功。
- 2
先行測試揭露偽造交易規則、手續費癱瘓、數值錨定、節奏交易、錯誤代幣經濟等失效模式,針對性改進後偽造賣規則率從 57% 降至 3%,手續費觀測從 32.5% 降至 <10%,資本部署率從 42.9% 提升至 78%。
- 3
系統可靠性並非僅來自基礎模型,而是由操作層(提示編譯、類型控制、政策驗證、執行保護、記憶設計、追蹤可觀測性)共同構成,證明完整路徑評估的重要性。
對教育工作者的啟發
對於設計自動化交易代理的實務工作者,本文強調需在模型之外構建完整的操作層:提示編譯、類型化控制、政策驗證、執行保護、記憶管理與追蹤可觀測性。先行測試應覆蓋偽造規則、手續費癱瘓、數值錨定等潛在失效,並透過針對性 harness 改進降低失效率。實際部署時,持續追蹤從用戶指令到最終結算的全流程,確保 99.9% 成交成功率,並利用大規模 trace 數據優化提示與決策邏輯。這些做法可提升資本部署率、降低風險,並為區塊鏈金融產品提供更高可靠性的基礎。
原始文獻資訊
- 英文標題:
- Operating-Layer Controls for Onchain Language-Model Agents Under Real Capital
- 作者:
- T. J. Barton, Chris Constantakis, Patti Hauseman, Annie Mous, Alaska Hoffman, Brian Bergeron, Hunter Goodreau
- 來源:
- arXiv - Artificial Intelligence
- AI 摘要模型:
- openai/gpt-oss-20b
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。