BOHM:零成本分層歸因於複合 AI 系統

arXiv - Artificial IntelligenceJoss Armstrong

提出 BOHM 方法,利用已存在的路由權重即時生成多層次歸因,零成本且不需存取組件內部,與 SHAP 互補。

AI 幫你先抓重點

AI 重點 1

BOHM 可在不訪問組件內部的情況下,利用路由權重即時提供多層次歸因,降低計算成本。

滑鼠懸停看 AI 判斷理由
這使得在第三方 API 或黑盒服務中仍能進行透明度分析,對於需要快速評估 AI 系統責任分配的實務者極具價值。
AI 重點 2

BOHM 與 SHAP 互補,當路由接近最優時兩者趨於一致,提供不同層級的洞察。

滑鼠懸停看 AI 判斷理由
了解兩種方法的差異可協助設計更精準的解釋機制,並在資源受限時選擇合適的歸因工具。

核心研究發現

  1. 1

    在 18 個 LLM 的 3 層級 LiveCodeBench 問題上,BOHM 的 Kendall tau 為 0.928,僅需 9,000 倍較少的 coalition 評估;而 SHAP 取得 0.980。

  2. 2

    在 5-driver、7-benchmark 的 agentic 研究中,驅動者集中路由於單一工具,BOHM 與 SHAP 的 cell-level tau 受驅動者首選工具是否為最佳工具影響,平均差異 +0.22 vs +0.01。

  3. 3

    在美國人口普查層級結構(475 個葉節點、4 層)中,BOHM 在每層級都能恢復真實排名,Kendall tau 高達 0.722。

對教育工作者的啟發

對於需要快速、低成本解釋複合 AI 系統的實務工作者,BOHM 直接利用路由權重即時產生多層次歸因,無需額外評估或存取黑盒組件。即使在第三方 API 或多工具協調器中,也能保持透明度並即時監控工具選擇。若路由已接近最佳,BOHM 與 SHAP 結果相近,可先用 BOHM 快速檢查;若路由偏離最優,則啟用 SHAP 進行細緻分析。將 BOHM 作為日常監控指標,可在發現異常時即時調整,提升模型治理與合規性。

原始文獻資訊

英文標題:
BOHM: Zero-Cost Hierarchical Attribution for Compound AI Systems
作者:
Joss Armstrong
來源:
arXiv - Artificial Intelligence
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。