自動語音辨識審計陷阱:失語症者案例研究
arXiv - Computers and SocietyKatelyn Xiaoying Mei, Anna Seo Gyeong Choi, Hilke Schellmann, Mona Sloane, Allison Koenecke
提出針對失語症者的 ASR 審計框架,揭示現行審計忽視多樣性與錯誤類型,證實六大系統對其表現較差。
AI 幫你先抓重點
AI 重點 1
標準審計忽視多樣性與錯誤類型,可能掩蓋失語症者的實際困難
滑鼠懸停看 AI 判斷理由
若只用單一文字標準化與 WER,審計結果會顯示表面公平,實際上卻隱藏了失語症者在發音變異與幻覺錯誤上的高風險,導致系統改進方向錯位。
AI 重點 2
採用多層次、社群驅動的審計框架能更準確評估 ASR 對不同語音障礙者的影響
滑鼠懸停看 AI 判斷理由
此框架將社群偏好與交叉子群納入評估,能揭示細緻的性能差距,為開發者提供針對性改進指標,進而提升公平性與使用者滿意度。
核心研究發現
- 1
發現現行 ASR 審計常用單一文字標準化,忽略多樣性與社群偏好,易掩蓋失語症者的表現差異。
- 2
提出整合多層次、社群驅動的審計框架,涵蓋多種文字標準化、交叉子群與非傳統指標,提升審計完整性。
- 3
在六大主流 ASR 系統的案例研究中,失語症者的錯誤率普遍高於對照組,證實現行系統對此族群不公平。
對教育工作者的啟發
實務工作者可依此框架優化 ASR 審計流程:① 先收集多種文字標準化樣本,避免單一標準化造成偏差;② 在報告中細分交叉子群(如性別、語音障礙類型、語音特徵),並針對每個子群呈現錯誤分布;③ 除 WER 外加入幻覺率、語音辨識一致性等指標;④ 與失語症者社群合作,確定其語音偏好與可接受的錯誤範圍;⑤ 透過迭代測試,將審計結果回饋至模型訓練,持續提升公平性。
原始文獻資訊
- 英文標題:
- Addressing Pitfalls in Auditing Practices of Automatic Speech Recognition Technologies: A Case Study of People with Aphasia
- 作者:
- Katelyn Xiaoying Mei, Anna Seo Gyeong Choi, Hilke Schellmann, Mona Sloane, Allison Koenecke
- 來源:
- arXiv - Computers and Society
- AI 摘要模型:
- openai/gpt-oss-20b
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。