權重剪枝放大偏見：多方法研究壓縮LLM於邊緣AI

arXiv - Computers and SocietyPlawan Kumar Rath, Rahul Maliakkal2026年5月12日

研究顯示權重剪枝在邊緣AI部署中會顯著放大偏見，且傳統困惑度評估無法揭示此風險。

AI 幫你先抓重點

AI 重點 1

剪枝雖能保持語言效能，卻可能把偏見放大到不可忽視的程度。

滑鼠懸停看 AI 判斷理由

此洞察提醒，傳統困惑度評估會給人錯誤安全感，實際部署前必須加入偏見驗證，否則會在邊緣AI中放大社會刻板印象。

AI 重點 2

無結構剪枝在實際硬體上不節省儲存或延遲，故其效益被誤解。

滑鼠懸停看 AI 判斷理由

這一發現指出，許多研究者將剪枝視為節能手段，但在真實設備上並無實際效益，應改為結構化剪枝或量化等更具實際效能的技術。

1
激活感知剪枝（Wanda）雖保持困惑度，但在70%稀疏度下，Stereotype Reliance Score提升83.7%，47-59%原本無偏見項目變得刻板。
2
隨機剪枝完全破壞語言能力（困惑度>10^4至10^8），但僅產生隨機機率偏見。
3
無結構剪枝在實際邊緣硬體上不節省儲存或延遲，削弱其部署動機。
4
78.3%密集vs剪枝比較顯著（p<0.05），剪枝的偏見轉換率（47-59%）遠高於量化（21%），顯示剪枝對對齊風險更大。

在部署壓縮LLM於IoT或邊緣裝置前，必須先進行偏見評估，使用多樣化基準（如BBQ）測試不同稀疏度；若使用Wanda等激活感知剪枝，需檢查Stereotype Reliance Score；考慮結構化剪枝或混合量化以兼顧效能與偏見控制；同時在硬體上測試實際儲存與延遲，避免僅依賴理論節省。

英文標題：: Weight Pruning Amplifies Bias: A Multi-Method Study of Compressed LLMs for Edge AI
作者：: Plawan Kumar Rath, Rahul Maliakkal
來源：: arXiv - Computers and Society
AI 摘要模型：: openai/gpt-oss-20b

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。