LLM對娛樂新聞更懷疑?

arXiv - Computers and SocietyHuiqian Lai

LLM在娛樂新聞真偽評估中顯示出明顯的誤判偏差,且不同模型差異顯著。

AI 幫你先抓重點

AI 重點 1

LLM將娛樂新聞視為知識層級較低,導致系統性誤判。

滑鼠懸停看 AI 判斷理由
此偏差揭示自動真偽評估工具可能無意中削弱娛樂新聞的可信度,影響媒體素養與公眾對新聞多樣性的認知。
AI 重點 2

提示工程可針對特定模型調整誤判率。

滑鼠懸停看 AI 判斷理由
示範簡單提示即可顯著降低部分模型的假陽性,顯示模型行為可被微調,但需針對性設計,提示並非萬能。

核心研究發現

  1. 1

    DeepSeek‑V3.2與GPT‑5.2在娛樂新聞上比硬新聞高出10.1%與8.8%的假陽性率,且差異顯著(p<.001)。

  2. 2

    Claude Opus 4.6與Gemini 3 Flash則未顯示類別差異,假陽性率相近。

  3. 3

    將提示改為「娛樂新聞事實核查員」可使DeepSeek‑V3.2假陽性率下降約50%,但對GPT‑5.2效果有限。

  4. 4

    風格交換實驗改變有限,說明偏差非僅由語調決定。

對教育工作者的啟發

課程設計者可將此研究納入媒體素養教學,示範AI評估工具對不同新聞類型的偏差,並教導學生使用提示工程調整模型判斷,提升批判性思考與媒體識讀能力。

原始文獻資訊

英文標題:
Are LLMs More Skeptical of Entertainment News?
作者:
Huiqian Lai
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。