Persona Prompted LLM 能否模擬子群體價值?文化對齊實證分析

arXiv - Computers and SocietyBryan Chen Zhengyu Tan, Zhengyuan Liu, Xiaoyuan Yi, Jing Yao, Xing Xie, Nancy F. Chen, Roy Ka-Wei Lee

研究發現即使 GPT‑4.1 也只能以 57.4% 的準確率預測新加坡不同族群的價值偏好,透過結構化微調可提升 17.4% 但同時擴大族群差距。

AI 幫你先抓重點

AI 重點 1

微調結構化偏好可顯著提升 LLM 在不同族群的文化對齊表現,但同時可能加劇公平性問題。

滑鼠懸停看 AI 判斷理由
此發現揭示了在追求準確率與維護公平性之間的權衡,對於設計跨文化 AI 系統的研究者與實務者而言,必須同時考量兩者以避免加劇族群不平等。
AI 重點 2

模型對年輕、男性、中國人、基督徒等族群的偏好預測更準確,提示在多元文化環境下仍存在固有偏差。

滑鼠懸停看 AI 判斷理由
這提醒開發者在選擇 persona 與訓練資料時需特別留意潛在偏差,並採用多元化樣本與公平性評估工具,以確保模型在不同族群間的表現更均衡。

核心研究發現

  1. 1

    GPT‑4.1 只能以 57.4% 的準確率預測子群體的模態偏好。

  2. 2

    結構化數值偏好微調後,對未見子群體的準確率平均提升 17.4%。

  3. 3

    微調雖提升平均表現,但在距離感知指標下,子群體間差距擴大。

  4. 4

    模型在模擬年輕、男性、中國人、基督徒等人群時表現較佳,存在先前偏差。

對教育工作者的啟發

在設計跨文化教材時,可利用微調後的 LLM 生成符合特定族群價值的內容,但需同時監測公平性指標,避免加劇族群偏差;建議使用多元樣本進行微調並搭配距離感知評估,以確保文化對齊與公平兼顧。

原始文獻資訊

英文標題:
Can Persona-Prompted LLMs Emulate Subgroup Values? An Empirical Analysis of Generalisability and Fairness in Cultural Alignment
作者:
Bryan Chen Zhengyu Tan, Zhengyuan Liu, Xiaoyuan Yi, Jing Yao, Xing Xie, Nancy F. Chen, Roy Ka-Wei Lee
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。