ai edtech higher education assessment learning design

實際資本下的鏈上語言模型代理操作層控制

arXiv - Artificial IntelligenceT. J. Barton, Chris Constantakis, Patti Hauseman, Annie Mous, Alaska Hoffman, Brian Bergeron, Hunter Goodreau2026年4月30日

研究在實際資本環境下，語言模型代理的可靠性如何透過操作層控制提升。

AI 幫你先抓重點

AI 重點 1

操作層控制是提升鏈上語言模型代理可靠性的關鍵

滑鼠懸停看 AI 判斷理由

因為可靠性源於系統級安全機制，而非單純模型，提示設計者需重視操作層的完整性與可觀測性，以確保實際交易安全。

AI 重點 2

針對性測試能顯著降低偽造規則與手續費失效，提升資本部署率

滑鼠懸停看 AI 判斷理由

展示了嚴謹的前置測試與針對性改進能大幅提升真實環境表現，為實務開發者提供可落地的測試與優化策略。

核心研究發現

1
3,505 代理於 21 天內交易實際 ETH，產生 7.5M 調用、300K 鏈上行為、$20M 交易量、5,000 ETH 部署、70B 推理 token、99.9% 成交成功。
2
先行測試揭露偽造交易規則、手續費癱瘓、數值錨定、節奏交易、錯誤代幣經濟等失效模式，針對性改進後偽造賣規則率從 57% 降至 3%，手續費觀測從 32.5% 降至 <10%，資本部署率從 42.9% 提升至 78%。
3
系統可靠性並非僅來自基礎模型，而是由操作層（提示編譯、類型控制、政策驗證、執行保護、記憶設計、追蹤可觀測性）共同構成，證明完整路徑評估的重要性。

對教育工作者的啟發

對於設計自動化交易代理的實務工作者，本文強調需在模型之外構建完整的操作層：提示編譯、類型化控制、政策驗證、執行保護、記憶管理與追蹤可觀測性。先行測試應覆蓋偽造規則、手續費癱瘓、數值錨定等潛在失效，並透過針對性 harness 改進降低失效率。實際部署時，持續追蹤從用戶指令到最終結算的全流程，確保 99.9% 成交成功率，並利用大規模 trace 數據優化提示與決策邏輯。這些做法可提升資本部署率、降低風險，並為區塊鏈金融產品提供更高可靠性的基礎。

原始文獻資訊

英文標題：: Operating-Layer Controls for Onchain Language-Model Agents Under Real Capital
作者：: T. J. Barton, Chris Constantakis, Patti Hauseman, Annie Mous, Alaska Hoffman, Brian Bergeron, Hunter Goodreau
來源：: arXiv - Artificial Intelligence
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。