識別與減輕學術推薦信中的性別暗示:一項可解釋性案例研究

arXiv - Computers and SocietyCharlotte S. Alexander, Shane Storks, Souradip Pal, Sayak Chakrabarty, Arushi Sharma, Mlen-Too Wesley, Bailey Russo

即使去除姓名與代詞,推薦信仍可透過語言暗示辨別申請人性別,且去除暗示後仍高於機率。

AI 幫你先抓重點

AI 重點 1

即使完全匿名化,推薦信仍透露性別,提示評審需檢視語言暗示以避免偏見。

滑鼠懸停看 AI 判斷理由
此洞察顯示偏見可在看似中性文字中存留,提醒教育工作者與政策制定者必須審核推薦文本,制定中性語言指引,才能真正提升錄取與聘任的公平性。
AI 重點 2

透過 TF‑IDF 與 SHAP 等可解釋方法,可定位並修正特定詞彙的性別偏差,為實務提供可操作的文本調整策略。

滑鼠懸停看 AI 判斷理由
說明可解釋 AI 能夠指導具體的詞彙替換與文本重構,讓機構能實施系統化干預並持續監測效果,進而提升決策透明度與責任感。

核心研究發現

  1. 1

    Transformer 和 LLM 在去除姓名、代詞後仍能以 68% 的準確率預測性別。

  2. 2

    TF-IDF 與 SHAP 分析顯示「情感」「人道主義」等詞彙是女性申請人的強烈語言指標。

  3. 3

    去除這些隱性性別暗示後,分類器準確率下降至 5.5% 之差,宏觀 F1 下降 2.7%,但仍高於隨機機率。

對教育工作者的啟發

對於招生與職位評審團隊,建議先使用自動化工具(如 TF‑IDF、SHAP)掃描推薦信,識別並去除「情感」或「人道主義」等高頻性別暗示詞;同時制定標準化語言模板,鼓勵推薦人使用中性描述;最後在評審前進行文本審核,確保評分者不受隱性偏見影響。此流程不僅提升公平性,也能在數據驅動的決策中提供可解釋的證據,方便政策追蹤與改進。

原始文獻資訊

英文標題:
Identifying and Mitigating Gender Cues in Academic Recommendation Letters: An Interpretability Case Study
作者:
Charlotte S. Alexander, Shane Storks, Souradip Pal, Sayak Chakrabarty, Arushi Sharma, Mlen-Too Wesley, Bailey Russo
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。