評估仇恨、反言與毒性對仇恨社群新人影響
arXiv - Computers and SocietyDaniel Hickey, Matheus Schmitz, Daniel M. T. Fessler, Paul E. Smaldino, Kristina Lerman, Goran Muri\'c, Keith Burghardt
研究發現,反言能降低新人在仇恨社群的持續參與,且其毒性不影響留存,但會促進同一討論中的持續敵意。
AI 幫你先抓重點
AI 重點 1
反言能有效降低新人在仇恨社群的留存率,提供一種非懲罰性干預策略。
滑鼠懸停看 AI 判斷理由
此發現顯示即使在極端環境中,適當的對話介入也能改變參與者的行為模式,對平台治理與教育介入設計具有實務意義。
AI 重點 2
高毒性反言雖不影響留存,但會激發持續敵意,提示介入需兼顧語氣與內容。
滑鼠懸停看 AI 判斷理由
了解毒性對社群互動的雙重影響,可協助設計更精細的反言範例與培訓,避免無意中加劇衝突。
核心研究發現
- 1
LLM偵測反言模型在104個仇恨子版上表現優於專門訓練的模型,提升偵測準確度。
- 2
反言評論的毒性低於仇恨言論,但仍比其他討論內容高近兩倍。
- 3
新人若在使用仇恨言論後收到反言,較不可能繼續在該子版發帖,顯示反言能抑制新人留存。
- 4
反言的毒性與新人留存無關,但高毒性反言會增加同一討論中仇恨使用者的持續敵意。
對教育工作者的啟發
對於社群平台管理者而言,可先部署LLM偵測系統,快速識別並回覆仇恨言論,並以非攻擊性語氣提供反言。建議制定反言範例庫,並訓練版主與自動化工具,避免使用過度毒性語言,因其可能激發持續敵意。教育工作者可將此研究作為案例,教導學生辨識與回應仇恨言論,培養批判性思維與數位公民素養。政策制定者可參考此證據,設計鼓勵正向互動的規範與激勵機制,並監測反言介入對社群氛圍的長期影響。
原始文獻資訊
- 英文標題:
- Assessing How Hate, Counterspeech, and Toxicity Affect Hate Group Newcomers
- 作者:
- Daniel Hickey, Matheus Schmitz, Daniel M. T. Fessler, Paul E. Smaldino, Kristina Lerman, Goran Muri\'c, Keith Burghardt
- 來源:
- arXiv - Computers and Society
- AI 摘要模型:
- openai/gpt-oss-20b
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。