利用社群參與式量表評估 AI 生成之文化文物圖像

arXiv - Computers and SocietyNari Johnson, Deepthi Sudharsan, Hamna, Samantha Dalal, Theo Holroyd, Anja Thieme, Hoda Heidari, Daniela Massiceti, Jennifer Wortman Vaughan, Cecily Morrison

本研究提出透過社群參與來定義「文化適切性」,並將其轉化為自動化 AI 評估工具的方法。

AI 幫你先抓重點

AI 重點 1

將「社群參與」置於概念定義階段而非僅在數據收集階段。

滑鼠懸停看 AI 判斷理由
這改變了傳統自動化評估可能忽略弱勢群體視角的困境,確保 AI 評估標準能真正反映受影響社群的文化價值與真實需求。
AI 重點 2

利用多模態 LLM 作為評估者的自動化潛力。

滑鼠懸停看 AI 判斷理由
這展示了如何將主觀、深層的文化知識轉化為可擴展的技術手段,為未來大規模、跨文化的 AI 內容審核提供了新的技術路徑。

核心研究發現

  1. 1

    研究提出將測量流程拆解為概念系統化、工具操作化與數據應用三個階段,並強調在系統化階段引入社群參與的重要性。

  2. 2

    透過對英國視障人士、喀拉拉邦與泰米爾納德邦居民的案例研究,成功將社群的 lived experiences 轉化為具體的文化評估指標。

  3. 3

    探討了如何利用多模態大型語言模型(LLM-as-a-judge)將社群定義的文化概念轉化為自動化評估工具,並識別出其中的挑戰。

對教育工作者的啟發

對於開發教育科技工具或數位教材的設計者而言,當 AI 被用於生成具有文化背景的教學素材(如歷史文物、民俗圖像)時,不應僅依賴技術指標,而應建立「社群參與式」的評估機制。建議在設計評估量表(Rubrics)時,先邀請目標學習社群或相關文化代表參與定義「正確」與「適切」的標準,再將這些標準轉化為 AI 檢測指令,以避免 AI 生成內容產生文化偏見或誤導學習者。

原始文獻資訊

英文標題:
Evaluating AI-Generated Images of Cultural Artifacts with Community-Informed Rubrics
作者:
Nari Johnson, Deepthi Sudharsan, Hamna, Samantha Dalal, Theo Holroyd, Anja Thieme, Hoda Heidari, Daniela Massiceti, Jennifer Wortman Vaughan, Cecily Morrison
來源:
arXiv - Computers and Society
AI 摘要模型:
/models/gemma-4-26B-A4B-it
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。