野外環境中的 LLM 幻覺:來自不存在引用的規模化證據

arXiv - Computers and SocietyZhenyue Zhao, Yihe Wang, Toby Stuart, Mathijs De Vaan, Paul Ginsparg, Yian Yin

研究發現 LLM 導致學術論文中虛假引用大幅增加,不僅威脅知識可靠性,更可能加劇學術不平等。

AI 幫你先抓重點

AI 重點 1

學術誠信面臨系統性風險

滑鼠懸停看 AI 判斷理由
這不僅是單純的技術錯誤,而是知識生產過程的污染。當 AI 生成的錯誤資訊進入學術循環,未來的研究者將在錯誤的基礎上進行建構,可能導致科學發現的連鎖反應式錯誤。
AI 重點 2

AI 可能加劇學術界的不平等

滑鼠懸停看 AI 判斷理由
這點揭示了技術偏見的社會影響。若 LLM 傾向於引用特定群體(如男性、知名學者),將會形成一種自動化的偏見循環,使邊緣化群體的貢獻更難被看見,影響學術公平性。

核心研究發現

  1. 1

    研究審核了 250 萬篇論文中的 1.11 億個引用,發現隨著 LLM 普及,虛假引用數量急劇上升,僅 2025 年估計就有 14.6 萬筆。

  2. 2

    幻覺引用在 AI 使用率高的領域、具有 AI 輔助寫作特徵的稿件,以及小型或初階研究團隊的論文中尤為顯著。

  3. 3

    虛假引用傾向於將學術功勞分配給已具知名度且為男性的學者,顯示 LLM 錯誤可能強化現有的學術不平等現象。

  4. 4

    現有的預印本審查與期刊出版流程僅能捕捉到極少數的錯誤,顯示幻覺內容的擴散速度已超過現有防護機制。

對教育工作者的啟發

教育工作者應將「AI 幻覺辨識」納入高等教育的學術寫作與資訊素養課程中。具體建議包括:1. 教導學生如何使用工具驗證引用來源的真實性,而非僅依賴 AI 生成的內容;2. 在課程設計中強調批判性思考,引導學生檢視 AI 輔助寫作可能帶來的偏見與錯誤;3. 鼓勵研究者在利用 AI 提升效率時,建立嚴謹的人工查核機制,以維護學術研究的可靠性與公平性。

原始文獻資訊

英文標題:
LLM hallucinations in the wild: Large-scale evidence from non-existent citations
作者:
Zhenyue Zhao, Yihe Wang, Toby Stuart, Mathijs De Vaan, Paul Ginsparg, Yian Yin
來源:
arXiv - Computers and Society
AI 摘要模型:
/models/gemma-4-26B-A4B-it
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。