可靠新聞還是宣傳新聞?利用文體、主題與說服技巧提升分類魯棒性的神經符號模型

arXiv - Computation and LanguageG\'eraud Faye, Benjamin Icard, Morgane Casanova, Guillaume Gadek, Guillaume Gravier, Wassila Ouerdane, C\'eline Hudelot, Sylvain Gatepaille, Paul \'Egr\'e

提出一種結合文本嵌入與符號概念特徵的神經符號模型,以提升偵測宣傳新聞時的分類魯棒性與泛化能力。

AI 幫你先抓重點

AI 重點 1

從單純的「內容分析」轉向「結構與策略分析」的範式轉移。

滑鼠懸停看 AI 判斷理由
這項研究強調了僅靠語義理解是不夠的,必須理解文本背後的文體結構與說服邏輯,這對於開發更具抗干擾能力的 AI 偵測系統至關重要。
AI 重點 2

神經符號(Neurosymbolic)結合是解決 AI 偏見與過擬合的有效路徑。

滑鼠懸停看 AI 判斷理由
純深度學習模型常受限於訓練數據的侷限,引入具備邏輯意義的符號特徵,能為模型提供更穩定的知識框架,提升其在未知環境下的判斷力。

核心研究發現

  1. 1

    研究發現傳統基於語言模型(如 BERT)的方法容易因數據收集偏差而產生過擬合問題,導致難以應對新來源。

  2. 2

    透過結合 fastText 非上下文文本嵌入與文體、主題及說服技巧等符號特徵,模型表現優於純文本方法。

  3. 3

    消融實驗與可解釋性分析證實,加入符號概念特徵能有效提升模型在不同新聞來源間的泛化能力與穩定性。

對教育工作者的啟發

對於教育工作者,特別是教授媒體素養(Media Literacy)的教師,此研究提供了新的教學視角:教導學生不僅要看「新聞說了什麼」(內容),更要分析「它是如何說的」(文體與說服技巧)。在設計數位素養課程時,可以引入「文體分析」與「說服策略辨識」作為評量指標,幫助學生建立更深層的批判性思考能力,而不僅僅是判斷事實真偽,從而提升學生在資訊爆炸時代的資訊辨識與自主學習能力。

原始文獻資訊

英文標題:
Reliable News or Propagandist News? A Neurosymbolic Model Using Genre, Topic, and Persuasion Techniques to Improve Robustness in Classification
作者:
G\'eraud Faye, Benjamin Icard, Morgane Casanova, Guillaume Gadek, Guillaume Gravier, Wassila Ouerdane, C\'eline Hudelot, Sylvain Gatepaille, Paul \'Egr\'e
來源:
arXiv - Computation and Language
AI 摘要模型:
/models/gemma-4-26B-A4B-it
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。