Persona Prompted LLM 能否模擬子群體價值？文化對齊實證分析

arXiv - Computers and SocietyBryan Chen Zhengyu Tan, Zhengyuan Liu, Xiaoyuan Yi, Jing Yao, Xing Xie, Nancy F. Chen, Roy Ka-Wei Lee2026年4月15日

研究發現即使 GPT‑4.1 也只能以 57.4% 的準確率預測新加坡不同族群的價值偏好，透過結構化微調可提升 17.4% 但同時擴大族群差距。

AI 幫你先抓重點

AI 重點 1

微調結構化偏好可顯著提升 LLM 在不同族群的文化對齊表現，但同時可能加劇公平性問題。

滑鼠懸停看 AI 判斷理由

此發現揭示了在追求準確率與維護公平性之間的權衡，對於設計跨文化 AI 系統的研究者與實務者而言，必須同時考量兩者以避免加劇族群不平等。

AI 重點 2

模型對年輕、男性、中國人、基督徒等族群的偏好預測更準確，提示在多元文化環境下仍存在固有偏差。

滑鼠懸停看 AI 判斷理由

這提醒開發者在選擇 persona 與訓練資料時需特別留意潛在偏差，並採用多元化樣本與公平性評估工具，以確保模型在不同族群間的表現更均衡。

在設計跨文化教材時，可利用微調後的 LLM 生成符合特定族群價值的內容，但需同時監測公平性指標，避免加劇族群偏差；建議使用多元樣本進行微調並搭配距離感知評估，以確保文化對齊與公平兼顧。

英文標題：: Can Persona-Prompted LLMs Emulate Subgroup Values? An Empirical Analysis of Generalisability and Fairness in Cultural Alignment
作者：: Bryan Chen Zhengyu Tan, Zhengyuan Liu, Xiaoyuan Yi, Jing Yao, Xing Xie, Nancy F. Chen, Roy Ka-Wei Lee
來源：: arXiv - Computers and Society
AI 摘要模型：: openai/gpt-oss-20b

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。