自動語音辨識審計陷阱:失語症者案例研究

arXiv - Computers and SocietyKatelyn Xiaoying Mei, Anna Seo Gyeong Choi, Hilke Schellmann, Mona Sloane, Allison Koenecke

提出針對失語症者的 ASR 審計框架,揭示現行審計忽視多樣性與錯誤類型,證實六大系統對其表現較差。

AI 幫你先抓重點

AI 重點 1

標準審計忽視多樣性與錯誤類型,可能掩蓋失語症者的實際困難

滑鼠懸停看 AI 判斷理由
若只用單一文字標準化與 WER,審計結果會顯示表面公平,實際上卻隱藏了失語症者在發音變異與幻覺錯誤上的高風險,導致系統改進方向錯位。
AI 重點 2

採用多層次、社群驅動的審計框架能更準確評估 ASR 對不同語音障礙者的影響

滑鼠懸停看 AI 判斷理由
此框架將社群偏好與交叉子群納入評估,能揭示細緻的性能差距,為開發者提供針對性改進指標,進而提升公平性與使用者滿意度。

核心研究發現

  1. 1

    發現現行 ASR 審計常用單一文字標準化,忽略多樣性與社群偏好,易掩蓋失語症者的表現差異。

  2. 2

    提出整合多層次、社群驅動的審計框架,涵蓋多種文字標準化、交叉子群與非傳統指標,提升審計完整性。

  3. 3

    在六大主流 ASR 系統的案例研究中,失語症者的錯誤率普遍高於對照組,證實現行系統對此族群不公平。

對教育工作者的啟發

實務工作者可依此框架優化 ASR 審計流程:① 先收集多種文字標準化樣本,避免單一標準化造成偏差;② 在報告中細分交叉子群(如性別、語音障礙類型、語音特徵),並針對每個子群呈現錯誤分布;③ 除 WER 外加入幻覺率、語音辨識一致性等指標;④ 與失語症者社群合作,確定其語音偏好與可接受的錯誤範圍;⑤ 透過迭代測試,將審計結果回饋至模型訓練,持續提升公平性。

原始文獻資訊

英文標題:
Addressing Pitfalls in Auditing Practices of Automatic Speech Recognition Technologies: A Case Study of People with Aphasia
作者:
Katelyn Xiaoying Mei, Anna Seo Gyeong Choi, Hilke Schellmann, Mona Sloane, Allison Koenecke
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。