教師對 AI 的利益與風險:跨55國 LLM 對齊與可控性審核

arXiv - Computers and SocietyYan Tao, Olga Viberg, Deepak Varuvel Dennison, Zhikun Wu, Ren\'e F. Kizilcec

透過跨55國教師調查與LLM評估,發現教師對AI的利弊觀感與LLM輸出高度不符,提示LLM不宜替代教師直接參與。

AI 幫你先抓重點

AI 重點 1

LLM輸出與教師實際感知高度偏離,可能誤導教師對AI的信任與採用決策。

滑鼠懸停看 AI 判斷理由
若教育政策或專業發展依賴LLM生成的建議,將導致教師對AI的誤判,進而影響教學實踐與資源配置。
AI 重點 2

部分高階模型(如 Gemini 3 Fast)能捕捉跨國排名趨勢,可用於快速假設生成與比較分析。

滑鼠懸停看 AI 判斷理由
這些模型雖不完美,但能提供跨國趨勢的初步洞察,協助研究者在缺乏實地數據時快速定位關鍵差異,提升研究效率。

核心研究發現

  1. 1

    教師對AI的利益與風險感知在55個國家呈現顯著跨國差異。

  2. 2

    八款先進LLM在一般與國家特定提示下,均未能準確反映各國教師的差異,且普遍高估利弊。

  3. 3

    進階推理模型與身份提示對提升LLM對教師觀感的對齊幾乎無效。

  4. 4

    部分高階模型(如 Gemini 3 Fast)能部分捕捉跨國排名趨勢,可作假設生成與探索性比較分析之輔助工具。

對教育工作者的啟發

1) 在設計AI工具或政策前,先進行教師實地調查以確定其利弊觀感;2) 避免僅依賴LLM輸出作為決策依據;3) 若使用LLM輔助分析,可選擇高階模型並結合國家特定提示;4) 針對不同國家差異,制定差異化培訓與支援方案。

原始文獻資訊

英文標題:
Teachers' Perceived Benefits and Risks of AI Across Fifty-Five Countries: An Audit of LLM Alignment and Steerability
作者:
Yan Tao, Olga Viberg, Deepak Varuvel Dennison, Zhikun Wu, Ren\'e F. Kizilcec
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。