實際資本下的鏈上語言模型代理操作層控制

arXiv - Artificial IntelligenceT. J. Barton, Chris Constantakis, Patti Hauseman, Annie Mous, Alaska Hoffman, Brian Bergeron, Hunter Goodreau

研究在實際資本環境下,語言模型代理的可靠性如何透過操作層控制提升。

AI 幫你先抓重點

AI 重點 1

操作層控制是提升鏈上語言模型代理可靠性的關鍵

滑鼠懸停看 AI 判斷理由
因為可靠性源於系統級安全機制,而非單純模型,提示設計者需重視操作層的完整性與可觀測性,以確保實際交易安全。
AI 重點 2

針對性測試能顯著降低偽造規則與手續費失效,提升資本部署率

滑鼠懸停看 AI 判斷理由
展示了嚴謹的前置測試與針對性改進能大幅提升真實環境表現,為實務開發者提供可落地的測試與優化策略。

核心研究發現

  1. 1

    3,505 代理於 21 天內交易實際 ETH,產生 7.5M 調用、300K 鏈上行為、$20M 交易量、5,000 ETH 部署、70B 推理 token、99.9% 成交成功。

  2. 2

    先行測試揭露偽造交易規則、手續費癱瘓、數值錨定、節奏交易、錯誤代幣經濟等失效模式,針對性改進後偽造賣規則率從 57% 降至 3%,手續費觀測從 32.5% 降至 <10%,資本部署率從 42.9% 提升至 78%。

  3. 3

    系統可靠性並非僅來自基礎模型,而是由操作層(提示編譯、類型控制、政策驗證、執行保護、記憶設計、追蹤可觀測性)共同構成,證明完整路徑評估的重要性。

對教育工作者的啟發

對於設計自動化交易代理的實務工作者,本文強調需在模型之外構建完整的操作層:提示編譯、類型化控制、政策驗證、執行保護、記憶管理與追蹤可觀測性。先行測試應覆蓋偽造規則、手續費癱瘓、數值錨定等潛在失效,並透過針對性 harness 改進降低失效率。實際部署時,持續追蹤從用戶指令到最終結算的全流程,確保 99.9% 成交成功率,並利用大規模 trace 數據優化提示與決策邏輯。這些做法可提升資本部署率、降低風險,並為區塊鏈金融產品提供更高可靠性的基礎。

原始文獻資訊

英文標題:
Operating-Layer Controls for Onchain Language-Model Agents Under Real Capital
作者:
T. J. Barton, Chris Constantakis, Patti Hauseman, Annie Mous, Alaska Hoffman, Brian Bergeron, Hunter Goodreau
來源:
arXiv - Artificial Intelligence
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。