ai social intelligence llm assessment human-ai interaction

溝通-預測-行動：評估 AI 代理人的社交智能

arXiv - Computers and SocietyDavid Shoresh, Sarit Kraus, Yonatan Loewenstein2026年4月13日

研究提出 COMPACT 協定，透過多玩家社交遊戲評估 LLM 代理人的社交智能及其多維度的社會認知指標。

AI 幫你先抓重點

AI 重點 1

社交智能不應僅以單一的勝率或評分來衡量

滑鼠懸停看 AI 判斷理由

傳統的標量評分（如 Elo 分數）無法捕捉社交行為的複雜性。透過多維度的社會認知指標，研究者能更精確地理解 AI 在社交情境中的具體強項與弱點，這對於開發具備社會能力的 AI 至關重要。

AI 重點 2

社交成功關鍵在於影響力與適應性，而非單純的邏輯規劃

滑鼠懸停看 AI 判斷理由

這挑戰了「強大推理能力等於強大社交能力」的直覺。在複雜的社會互動中，如何透過溝通影響他人並根據環境變化調整策略，比單純的深層規劃更能決定社交成效。

核心研究發現

1
研究透過 COMPACT 互動協定評估了 8 種不同規模（24B 至 1T 參數）的 LLM，發現模型間存在顯著的性能差異。
2
開發了包含行動預測、溝通影響力、策略推理及利益衝突權衡等維度的社會認知指標，能有效預測代理人的勝率（AUC ROC = 0.82）。
3
特徵重要性分析顯示，影響力、透明度與適應性對成功的預測力，高於心智理論（ToM）推論或深層規劃能力。

對教育工作者的啟發

對於教育科技開發者而言，此研究提示我們在設計 AI 學習夥伴或協作教學工具時，不應僅著重於 AI 的知識正確性或邏輯推理，更應強化其「社交適應性」與「溝通透明度」。例如，在 PBL（專題式學習）的 AI 輔助討論中，AI 應具備能觀察小組動態、適時介入並透過溝通引導學生（而非僅僅提供答案）的能力。開發者可以參考文中提出的社會認知指標，來評估 AI 代理人在模擬社交情境中的表現，進而優化其在真實教學場景中的協作品質。

原始文獻資訊

英文標題：: Communicate-Predict-Act: Evaluating Social Intelligence of Agents
作者：: David Shoresh, Sarit Kraus, Yonatan Loewenstein
來源：: arXiv - Computers and Society
AI 摘要模型：: /models/gemma-4-26B-A4B-it

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。