ai edtech human-computer interaction affective computing learning design

評估主動式對話代理人中的多模態情緒識別研究

arXiv - Human-Computer InteractionAdnana Dragut, Raquel Lacuesta, F. Xavier Gaya-Morey, Jose M. Buades-Rubio2026年5月21日

研究發現與 AI 對話時視覺表情易出現「撲克臉」偏差，語義分析在情緒識別上比視覺辨識更可靠。

AI 幫你先抓重點

AI 重點 1

情緒辨識應從「視覺導向」轉向「語義與情境導向」

滑鼠懸停看 AI 判斷理由

這挑戰了傳統多模態感測依賴視覺表情的假設。在人機互動中，人類會因心理狀態改變表現行為，開發者應優先強化語言情境分析，以避免視覺誤判導致的互動錯誤。

AI 重點 2

主動性（Proactivity）的介入必須具備精準的動態校準

滑鼠懸停看 AI 判斷理由

這提醒了 AI 設計者，單純的「主動」並不等於「有效」。若無法根據使用者的情緒演變進行動態調整，過度的主動反而會破壞學習或互動的自然感，造成負面體驗。

核心研究發現

1
研究發現使用者在與 AI 對話時會出現「撲克臉」現象，即使內心感到愉悅，臉部表情仍呈現嚴肅或專注的狀態。
2
生成式 AI 的語義語言分析在辨識使用者情緒方面，比基於電腦視覺的臉部辨識模組更具可靠性與準確度。
3
主動式社交互動代理人（SIA）能透過調整對話主題與使用共情或幽默語言，有效引發使用者的特定情緒。
4
若代理人的主動性缺乏適當校準，可能會導致使用者產生疏離感，並認為互動過程過於人工化。

對教育工作者的啟發

對於開發 AI 學習夥伴（Learning Companion）的設計者，建議不要過度依賴攝影機捕捉的表情來判斷學生的學習情緒（如挫折或興奮），因為學生在面對機器時可能表現出不自然的表情。相反地，應加強對學生對話內容、語氣與語義脈絡的分析。此外，在設計主動式教學引導時，應建立情緒緩衝機制，確保 AI 的介入時機與語氣（如共情或幽默）能與學生的情緒狀態同步，避免因過於機械式的主動介入而導致學生產生抗拒或分心。

原始文獻資訊

英文標題：: Evaluating multimodal emotion recognition in proactive conversational agents: A user study
作者：: Adnana Dragut, Raquel Lacuesta, F. Xavier Gaya-Morey, Jose M. Buades-Rubio
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: /models/gemma-4-26B-A4B-it

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。