大型語言模型社會偏見雙指標評估：尼泊爾文化背景研究

arXiv - Computers and SocietyAshish Pandey, Tek Raj Chhetri2026年3月10日

本研究系統性分析七款大型語言模型在尼泊爾文化背景下的性別刻板印象，並提出結合顯性與隱性偏見的評估框架。

AI 幫你先抓重點

AI 重點 1

本研究提出雙指標偏見評估 (DMBA) 框架，結合顯性偏見同意度與隱性完成偏見率，更全面評估 LLM 在尼泊爾文化背景下的性別刻板印象。

滑鼠懸停看 AI 判斷理由

DMBA 框架的提出，突破了傳統僅以「同意度」指標評估偏見的限制，揭示了 LLM 在生成內容時的隱性偏見，這對於教育科技研究者理解 LLM 的真實偏見程度，以及開發更有效的去偏見策略至關重要。它也提醒教育工作者，LLM 產出的內容可能潛藏著不易察覺的偏見。

AI 重點 2

研究發現隱性完成偏見與溫度參數呈現 U 型關係，適度隨機性 (T=0.3) 時偏見最明顯，暗示 LLM 在生成時對刻板印象的依賴程度受控於溫度設定。

滑鼠懸停看 AI 判斷理由

這項發現對於 LLM 開發者具有直接的實務意義，他們可以透過調整溫度參數，在一定程度上控制模型生成內容的偏見程度。同時，也提醒教育工作者在使用 LLM 進行教學時，應注意溫度設定可能帶來的影響，並鼓勵學生批判性思考模型產出的內容。

教育工作者應意識到大型語言模型可能存在的文化偏見，並在教學和學習過程中謹慎使用。模型開發者應積極探索減少偏見的方法，例如使用更具代表性的訓練數據，並開發更精確的偏見檢測工具。此外，在設計基於 LLM 的學習活動時，應鼓勵學生批判性思考模型產生的內容，培養其辨別偏見的能力，並促進多元文化理解。

英文標題：: Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context
作者：: Ashish Pandey, Tek Raj Chhetri
來源：: arXiv - Computers and Society
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。