當名稱改變判決：介入一致性揭示大型語言模型決策中的系統性偏差

arXiv - Computers and SocietyAbhinaba Basu, Pavan Chakraborty2026年3月20日

本研究透過介入一致性測試框架（ICE-Guard）揭示大型語言模型在決策中存在的系統性偏差，並發現權威與框架偏差遠超人口統計偏差。

AI 幫你先抓重點

AI 重點 1

大型語言模型存在系統性偏差，且權威與框架偏差更為顯著。

滑鼠懸停看 AI 判斷理由

此發現挑戰了目前對AI偏差的理解，提醒教育工作者在運用大型語言模型進行評估或決策時，需注意潛在的非人口統計偏差，並進行更全面的評估。

AI 重點 2

結構化分解能有效降低大型語言模型的偏差。

滑鼠懸停看 AI 判斷理由

此方法為教育科技的開發者提供了具體的技術方向，透過將決策過程分解為特徵提取和規則判斷，可以有效降低AI系統的偏誤，提升其公平性與可靠性。

核心研究發現

1
權威偏差（平均5.8%）和框架偏差（5.0%）顯著高於人口統計偏差（2.2%），挑戰了學界對人口統計偏差的過度關注。
2
偏差集中在特定領域，例如金融領域的權威偏差高達22.6%，而刑事司法領域則僅為2.8%。
3
結構化分解，即讓大型語言模型提取特徵，並由確定性規則決定，可將翻轉率降低高達100%（9個模型的中位數為49%）。
4
透過ICE引導的偵測-診斷-減緩-驗證迴圈，可實現累計78%的偏差降低，透過迭代提示修補。
5
使用真實COMPAS再犯數據進行驗證，發現COMPAS衍生的翻轉率超過了匯集後的合成率，表明基準提供了一個保守的實際偏差估計。

對教育工作者的啟發

教育工作者在運用大型語言模型進行學生評估、學習資源推薦或教學決策時，應意識到模型可能存在的系統性偏差。建議採用結構化分解方法，例如明確定義評估標準和流程，並定期使用ICE-Guard等工具進行偏差檢測與修正。此外，應避免過度依賴大型語言模型的單一判斷，並結合人工評估，以確保公平性和準確性。研究也提醒我們，在教育領域應用AI時，應關注更廣泛的偏差來源，而不僅僅是人口統計特徵。

原始文獻資訊

英文標題：: When Names Change Verdicts: Intervention Consistency Reveals Systematic Bias in LLM Decision-Making
作者：: Abhinaba Basu, Pavan Chakraborty
來源：: arXiv - Computers and Society
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。