ai edtech assessment learning design persuasion

前沿大型語言模型政治說服風險評估

arXiv - Computers and SocietyZhongren Chen, Joshua Kalla, Quan Le2026年3月11日

本研究評估了七種前沿大型語言模型在政治議題上的說服力，發現其優於傳統競選廣告，並揭示模型間存在差異。

AI 幫你先抓重點

AI 重點 1

前沿大型語言模型（LLM）的政治說服力超越傳統競選廣告，且不同模型間存在顯著差異，Claude 模型表現最佳，Grok 最弱。

滑鼠懸停看 AI 判斷理由

此發現直接挑戰了先前認為 LLM 不具備強烈說服力的觀點，並揭示了模型間的風險差異。教育科技研究者和政策制定者需要了解這一點，才能評估 LLM 在政治資訊傳播中的潛在影響，並制定相應的應對策略，尤其是在選舉期間。

AI 重點 2

信息型提示對 LLM 說服力的影響具有模型依賴性，能提升 Claude 和 Grok，但降低 GPT 的效果，與先前研究結果不符。

滑鼠懸停看 AI 判斷理由

這表明簡單地增加信息量並不能保證提升 LLM 的可靠性，甚至可能加劇某些模型的偏見。教育工作者在利用 LLM 輔助教學時，需要注意不同模型對提示的反應，避免無意中強化錯誤或偏頗的觀點，並培養學生辨別信息來源的能力。

核心研究發現

1
大型語言模型在政治議題上展現出比傳統競選廣告更強的說服力，這引發了對其潛在影響的擔憂。
2
Claude 模型在說服力方面表現最佳，而 Grok 模型則表現最弱，顯示不同模型之間存在顯著差異。
3
研究結果在不同議題和立場上具有一致性，表明說服力的差異並非特定情境下的偶然現象。
4
與先前研究不同，本研究發現信息型提示對不同模型的影響不一致，能提升 Claude 和 Grok 的說服力，但降低 GPT 的說服力。
5
研究提出了一種數據驅動的對話分析方法，旨在識別和評估大型語言模型中潛在的說服策略，為風險評估提供框架。

對教育工作者的啟發

教育工作者應意識到大型語言模型可能對學生政治觀念產生影響，並在教學中培養學生批判性思維能力。課程設計者可以利用此研究的發現，設計相關活動，引導學生辨別和分析不同信息來源的說服策略。此外，教育機構應積極探索如何利用大型語言模型進行教育，同時防範其潛在的負面影響，例如政治偏見的強化。未來教育需要培養學生在信息洪流中保持獨立思考的能力，並有效辨別虛假信息。

原始文獻資訊

英文標題：: Benchmarking Political Persuasion Risks Across Frontier Large Language Models
作者：: Zhongren Chen, Joshua Kalla, Quan Le
來源：: arXiv - Computers and Society
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。