ai edtech assessment learning design knowledge building

BOHM：零成本分層歸因於複合 AI 系統

arXiv - Artificial IntelligenceJoss Armstrong2026年5月25日

提出 BOHM 方法，利用已存在的路由權重即時生成多層次歸因，零成本且不需存取組件內部，與 SHAP 互補。

AI 幫你先抓重點

AI 重點 1

BOHM 可在不訪問組件內部的情況下，利用路由權重即時提供多層次歸因，降低計算成本。

滑鼠懸停看 AI 判斷理由

這使得在第三方 API 或黑盒服務中仍能進行透明度分析，對於需要快速評估 AI 系統責任分配的實務者極具價值。

AI 重點 2

BOHM 與 SHAP 互補，當路由接近最優時兩者趨於一致，提供不同層級的洞察。

滑鼠懸停看 AI 判斷理由

了解兩種方法的差異可協助設計更精準的解釋機制，並在資源受限時選擇合適的歸因工具。

核心研究發現

1
在 18 個 LLM 的 3 層級 LiveCodeBench 問題上，BOHM 的 Kendall tau 為 0.928，僅需 9,000 倍較少的 coalition 評估；而 SHAP 取得 0.980。
2
在 5-driver、7-benchmark 的 agentic 研究中，驅動者集中路由於單一工具，BOHM 與 SHAP 的 cell-level tau 受驅動者首選工具是否為最佳工具影響，平均差異 +0.22 vs +0.01。
3
在美國人口普查層級結構（475 個葉節點、4 層）中，BOHM 在每層級都能恢復真實排名，Kendall tau 高達 0.722。

對教育工作者的啟發

對於需要快速、低成本解釋複合 AI 系統的實務工作者，BOHM 直接利用路由權重即時產生多層次歸因，無需額外評估或存取黑盒組件。即使在第三方 API 或多工具協調器中，也能保持透明度並即時監控工具選擇。若路由已接近最佳，BOHM 與 SHAP 結果相近，可先用 BOHM 快速檢查；若路由偏離最優，則啟用 SHAP 進行細緻分析。將 BOHM 作為日常監控指標，可在發現異常時即時調整，提升模型治理與合規性。

原始文獻資訊

英文標題：: BOHM: Zero-Cost Hierarchical Attribution for Compound AI Systems
作者：: Joss Armstrong
來源：: arXiv - Artificial Intelligence
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。