生成模範勞工：大型語言模型中種族與性別的交叉模型審查

arXiv - Computers and SocietyIlona van der Linden, Sahana Kumar, Arnav Dixit, Aadi Sudan, Smruthi Danda, David C. Anastasiu, Kai Lukoff2026年3月30日

本研究審查了四種大型語言模型在 41 種職業中生成的人格化資料，發現模型在種族和性別呈現上存在偏差，並加劇了職業隔離。

AI 幫你先抓重點

AI 重點 1

模型在職業描繪中存在系統性偏見。

滑鼠懸停看 AI 判斷理由

此研究揭示了大型語言模型在生成職業人格化資料時，會系統性地扭曲種族和性別的呈現，這對於理解 AI 在塑造社會認知方面的潛在影響至關重要，並提醒我們在教育和就業領域使用 AI 時需要謹慎。

AI 重點 2

職業刻板印象被 AI 模型放大。

滑鼠懸停看 AI 判斷理由

研究發現 AI 模型不僅未能消除職業刻板印象，反而通過過度呈現特定族群，加劇了現有的職業隔離現象。這對於教育工作者設計多元化的職業探索課程，以及避免學生形成偏見具有重要意義。

核心研究發現

1
大型語言模型生成的職業人口統計資料的變異性低於現實世界數據，傾向於將每個職業壓縮為一個主導的人口統計資料。
2
白人和黑人勞工在模型生成的人格化資料中普遍被低估，分別低了 31 個百分點和 9 個百分點。
3
拉丁裔和亞裔勞工則被過度估計，分別高了 17 個百分點和 12 個百分點，並伴有刻板印象的放大。
4
某些職業中出現極端的失衡，例如家政婦幾乎完全由拉丁裔人士描繪，而許多職業中黑人勞工則被近乎抹去。
5
這些模式在不同機構和文化背景的模型中普遍存在，表明存在共享的結構性偏見來源，而非模型特定的問題。

對教育工作者的啟發

教育工作者應意識到 AI 生成內容可能存在的偏見，並將其納入批判性思維課程中，引導學生辨別和解構 AI 產生的刻板印象。在利用 AI 工具進行職業探索時，應積極尋求多元化的數據來源，並鼓勵學生挑戰 AI 生成的預設形象。此外，課程設計者應考慮將此研究的發現融入到相關的討論中，提升學生對 AI 倫理的意識和理解。

原始文獻資訊

英文標題：: Generating the Modal Worker: A Cross-Model Audit of Race and Gender in LLM-Generated Personas Across 41 Occupations
作者：: Ilona van der Linden, Sahana Kumar, Arnav Dixit, Aadi Sudan, Smruthi Danda, David C. Anastasiu, Kai Lukoff
來源：: arXiv - Computers and Society
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。