ai higher education knowledge building academic integrity edtech

野外環境中的 LLM 幻覺：來自不存在引用的規模化證據

arXiv - Computers and SocietyZhenyue Zhao, Yihe Wang, Toby Stuart, Mathijs De Vaan, Paul Ginsparg, Yian Yin2026年5月11日

研究發現 LLM 導致學術論文中虛假引用大幅增加，不僅威脅知識可靠性，更可能加劇學術不平等。

AI 幫你先抓重點

AI 重點 1

學術誠信面臨系統性風險

滑鼠懸停看 AI 判斷理由

這不僅是單純的技術錯誤，而是知識生產過程的污染。當 AI 生成的錯誤資訊進入學術循環，未來的研究者將在錯誤的基礎上進行建構，可能導致科學發現的連鎖反應式錯誤。

AI 重點 2

AI 可能加劇學術界的不平等

滑鼠懸停看 AI 判斷理由

這點揭示了技術偏見的社會影響。若 LLM 傾向於引用特定群體（如男性、知名學者），將會形成一種自動化的偏見循環，使邊緣化群體的貢獻更難被看見，影響學術公平性。

核心研究發現

1
研究審核了 250 萬篇論文中的 1.11 億個引用，發現隨著 LLM 普及，虛假引用數量急劇上升，僅 2025 年估計就有 14.6 萬筆。
2
幻覺引用在 AI 使用率高的領域、具有 AI 輔助寫作特徵的稿件，以及小型或初階研究團隊的論文中尤為顯著。
3
虛假引用傾向於將學術功勞分配給已具知名度且為男性的學者，顯示 LLM 錯誤可能強化現有的學術不平等現象。
4
現有的預印本審查與期刊出版流程僅能捕捉到極少數的錯誤，顯示幻覺內容的擴散速度已超過現有防護機制。

對教育工作者的啟發

教育工作者應將「AI 幻覺辨識」納入高等教育的學術寫作與資訊素養課程中。具體建議包括：1. 教導學生如何使用工具驗證引用來源的真實性，而非僅依賴 AI 生成的內容；2. 在課程設計中強調批判性思考，引導學生檢視 AI 輔助寫作可能帶來的偏見與錯誤；3. 鼓勵研究者在利用 AI 提升效率時，建立嚴謹的人工查核機制，以維護學術研究的可靠性與公平性。

原始文獻資訊

英文標題：: LLM hallucinations in the wild: Large-scale evidence from non-existent citations
作者：: Zhenyue Zhao, Yihe Wang, Toby Stuart, Mathijs De Vaan, Paul Ginsparg, Yian Yin
來源：: arXiv - Computers and Society
AI 摘要模型：: /models/gemma-4-26B-A4B-it

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。