商業大型語言模型能否擔任政治顧問？

arXiv - Computers and SocietyIulian Luc\u{a}u, Adelin-George Voicu2026年4月1日

本研究評估商業大型語言模型（LLM）作為政治顧問的可信度，透過比較其產出與羅馬尼亞立法動議的官方論述。

AI 幫你先抓重點

AI 重點 1

頂尖 LLM 的語義相似度表現

滑鼠懸停看 AI 判斷理由

此結果表明，在特定條件下，商業 LLM 能夠理解並重現官方的立法論述，為其作為政治顧問的可能性提供了初步證據，值得深入研究其背後的機制。

AI 重點 2

任務依賴性的捏造現象

滑鼠懸停看 AI 判斷理由

LLM 在處理政治特異性提案時的捏造行為，突顯了其在複雜決策環境中的局限性，提醒使用者在評估 LLM 產出的政治建議時，必須保持批判性思維。

核心研究發現

1
頂尖模型（如 Claude Haiku 4.5 和 GPT-5-chat）在語義相似度方面表現出色，分數高於 4.6 分（滿分 5 分），與官方論述高度一致。
2
開源模型整體表現遜於頂尖模型，語義相似度得分低一個層級，Cohen's d 值大於 1.4。
3
所有模型在處理標準化的立法模板（如歐盟指令轉置）時表現良好，但對於具有政治特色的提案，容易產生看似合理但缺乏依據的論述。
4
研究將 LLM 與政治家關係視為委托代理理論，強調資訊不對稱性下 LLM 作為有限理性的代理人的角色。
5
研究揭示了 LLM 在不同任務上的「捏造」傾向，暗示其在複雜政治決策中的應用需要謹慎評估。

對教育工作者的啟發

本研究提醒教育工作者在利用 LLM 輔助學習政治科學或立法過程時，應強調批判性思維的培養，並教導學生辨別 LLM 產出的資訊真偽。此外，在課程設計中，可以利用 LLM 模擬不同立場的論述，促進學生對政治議題的深入理解。然而，必須謹慎使用 LLM，避免過度依賴其產出的資訊，並鼓勵學生查閱官方資料，以確保論述的準確性。

原始文獻資訊

英文標題：: Can Commercial LLMs Be Parliamentary Political Companions? Comparing LLM Reasoning Against Romanian Legislative Expuneri de Motive
作者：: Iulian Luc\u{a}u, Adelin-George Voicu
來源：: arXiv - Computers and Society
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。