ai edtech knowledge building neurodiversity assessment

當機器出錯時：大型語言模型比人類更常延續自閉症迷思

arXiv - Computers and SocietyEduardo C. Garrido-Merch\'an, Adriana Constanza Cirera Tirschtigel2026年3月10日

這項研究發現，大型語言模型在呈現自閉症相關資訊時，反而比人類更容易延續有害的刻板印象，揭示了AI系統在理解和傳達複雜健康議題上的盲點。

AI 幫你先抓重點

AI 重點 1

大型語言模型（LLMs）在自閉症知識測驗中，錯誤率高於人類，達 44.8%，顯示 AI 系統反而更容易延續自閉症的刻板印象。

滑鼠懸停看 AI 判斷理由

此發現顛覆了對 AI 的常規期待，即認為 AI 擁有龐大數據集能提供更準確的資訊。這突顯了 AI 在理解和傳達複雜的社會議題時的盲點，對於教育科技研究者和 AI 開發者而言，了解此一弱點至關重要，以便改進 AI 系統的設計和訓練，避免加劇對弱勢群體的誤解。

AI 重點 2

研究強調在 AI 開發中納入神經多樣性（neurodiversity）視角的必要性，以確保 AI 系統能準確且尊重地呈現自閉症相關知識。

滑鼠懸停看 AI 判斷理由

這不僅僅是技術層面的建議，更涉及倫理考量。忽略神經多樣性視角可能導致 AI 系統強化現有的偏見，影響使用者對自閉症的認知。對於特殊教育工作者和關注神經多樣性議題的專業人士而言，此一重點有助於推動更包容、更理解的 AI 應用，並促進人機協作，共同創造更友善的學習環境。

核心研究發現

1
研究結果顯示，大型語言模型（LLMs）在自閉症知識測驗中，錯誤率顯著高於人類參與者（44.8% vs. 36.2%），這與預期相反。
2
在30個評估項目中，有18個項目中，人類的表現明顯優於AI系統，顯示人類在理解自閉症相關知識方面更準確。
3
這項研究揭示了當前AI系統在處理和呈現弱勢群體相關資訊時，存在著關鍵的盲點，需要加以改進。
4
大型語言模型雖然擁有龐大的訓練數據，但並未有效利用這些數據來提升對自閉症的理解，反而更容易延續既有的迷思。
5
研究結果強調了在AI開發中，納入神經多樣性（neurodiversity）視角的必要性，以確保AI系統能夠更準確、更敏感地處理相關議題。

對教育工作者的啟發

教育工作者和課程設計者應意識到，目前的大型語言模型在提供自閉症相關資訊時，可能存在偏誤和不準確性。在使用AI工具時，應保持批判性思考，並驗證信息的可靠性。此外，在AI系統的開發過程中，應積極納入神經多樣性視角，確保AI能夠準確、尊重地呈現自閉症相關知識，避免延續有害的刻板印象。未來教育科技的發展，應著重於提升AI系統在處理複雜社會議題時的敏感度和準確性，並鼓勵人機協作，共同促進更包容、更理解的學習環境。

原始文獻資訊

英文標題：: When Machines Get It Wrong: Large Language Models Perpetuate Autism Myths More Than Humans Do
作者：: Eduardo C. Garrido-Merch\'an, Adriana Constanza Cirera Tirschtigel
來源：: arXiv - Computers and Society
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。