基於價值編碼本的分佈式開放式LLM文化價值對齊評估

arXiv - Computers and SocietyJaehyeok Lee, Xiaoyuan Yi, Jing Yao, Hyunjin Hwang, Roy Ka-Wei Lee, Xing Xie, JinYeong Bak2026年4月9日

提出 DOVE 框架，利用分佈式評估與最優傳輸衡量 LLM 文化價值對齊，提升預測效度。

AI 幫你先抓重點

AI 重點 1

DOVE 的分佈式評估方法避免了傳統多選題的限制，能更真實反映 LLM 的文化價值取向。

滑鼠懸停看 AI 判斷理由

此方法直接比較人類文本分佈與 LLM 產出，捕捉細微價值差異，對安全與使用者參與度評估更具實際意義。

AI 重點 2

利用最優傳輸衡量子群多樣性，DOVE 能揭示不同文化子群間的價值差異，為跨文化模型調整提供指標。

滑鼠懸停看 AI 判斷理由

了解子群差異可幫助開發者針對特定族群調整模型，提升公平性與適應性，避免單一文化偏見。

透過 DOVE 可評估 AI 生成教材是否符合目標文化價值，並調整內容以提升學生參與與安全；可將價值編碼本納入課程設計，確保多元文化代表性；教師可利用 500 範例快速驗證模型，節省資源。

英文標題：: Distributional Open-Ended Evaluation of LLM Cultural Value Alignment Based on Value Codebook
作者：: Jaehyeok Lee, Xiaoyuan Yi, Jing Yao, Hyunjin Hwang, Roy Ka-Wei Lee, Xing Xie, JinYeong Bak
來源：: arXiv - Computers and Society
AI 摘要模型：: openai/gpt-oss-20b

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。