評估仇恨、反言與毒性對仇恨社群新人影響

arXiv - Computers and SocietyDaniel Hickey, Matheus Schmitz, Daniel M. T. Fessler, Paul E. Smaldino, Kristina Lerman, Goran Muri\'c, Keith Burghardt

研究發現,反言能降低新人在仇恨社群的持續參與,且其毒性不影響留存,但會促進同一討論中的持續敵意。

AI 幫你先抓重點

AI 重點 1

反言能有效降低新人在仇恨社群的留存率,提供一種非懲罰性干預策略。

滑鼠懸停看 AI 判斷理由
此發現顯示即使在極端環境中,適當的對話介入也能改變參與者的行為模式,對平台治理與教育介入設計具有實務意義。
AI 重點 2

高毒性反言雖不影響留存,但會激發持續敵意,提示介入需兼顧語氣與內容。

滑鼠懸停看 AI 判斷理由
了解毒性對社群互動的雙重影響,可協助設計更精細的反言範例與培訓,避免無意中加劇衝突。

核心研究發現

  1. 1

    LLM偵測反言模型在104個仇恨子版上表現優於專門訓練的模型,提升偵測準確度。

  2. 2

    反言評論的毒性低於仇恨言論,但仍比其他討論內容高近兩倍。

  3. 3

    新人若在使用仇恨言論後收到反言,較不可能繼續在該子版發帖,顯示反言能抑制新人留存。

  4. 4

    反言的毒性與新人留存無關,但高毒性反言會增加同一討論中仇恨使用者的持續敵意。

對教育工作者的啟發

對於社群平台管理者而言,可先部署LLM偵測系統,快速識別並回覆仇恨言論,並以非攻擊性語氣提供反言。建議制定反言範例庫,並訓練版主與自動化工具,避免使用過度毒性語言,因其可能激發持續敵意。教育工作者可將此研究作為案例,教導學生辨識與回應仇恨言論,培養批判性思維與數位公民素養。政策制定者可參考此證據,設計鼓勵正向互動的規範與激勵機制,並監測反言介入對社群氛圍的長期影響。

原始文獻資訊

英文標題:
Assessing How Hate, Counterspeech, and Toxicity Affect Hate Group Newcomers
作者:
Daniel Hickey, Matheus Schmitz, Daniel M. T. Fessler, Paul E. Smaldino, Kristina Lerman, Goran Muri\'c, Keith Burghardt
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。