ai edtech assessment learning design higher education

AffectGPT-RL：探索強化學習在開放詞彙情緒辨識中的角色

arXiv - Human-Computer InteractionZheng Lian, Fan Zhang, Lan Chen, Yazhou Zhang, Rui Liu, Jinyang Wu, Haoyu Chen, Xiaobai Li, Xiaojiang Peng, Bin He, Jianhua Tao2026年5月8日

利用強化學習優化非可微分評估指標，AffectGPT-RL 在開放詞彙情緒辨識與基本情緒辨識上顯著提升表現。

AI 幫你先抓重點

AI 重點 1

強化學習能直接優化非可微分的評估指標，解決傳統訓練目標與評分標準不一致的問題。

滑鼠懸停看 AI 判斷理由

在情緒辨識領域，評估往往基於情緒輪或多維度指標，這些指標難以用梯度直接優化。AffectGPT-RL 透過 RL 讓模型學習如何最大化實際評分，從而提升實際應用效果。

AI 重點 2

推理過程的加入是提升細緻情緒辨識的關鍵因素。

滑鼠懸停看 AI 判斷理由

推理過程使模型能在生成情緒標籤前進行多步推斷，捕捉更細微的情緒變化，這對於開放詞彙情緒辨識尤為重要，能有效減少誤判。

核心研究發現

1
AffectGPT-RL 透過強化學習顯著提升開放詞彙情緒辨識（OV-MER）的準確率，超越傳統基於 token-level 損失的模型。
2
實驗證明，加入推理過程（reasoning process）對於細緻情緒辨識至關重要，缺少此步驟會導致性能明顯下降。
3
不同的獎勵設計（reward）對模型表現影響顯著，適當的情緒輪（emotion wheel）獎勵能進一步提升辨識精度。
4
AffectGPT-RL 在基本情緒辨識任務 MER-UniBench 上達成領先成果，證明其框架具備跨任務的可擴展性。

對教育工作者的啟發

對於教育平台開發者而言，將 AffectGPT‑RL 整合至學習管理系統，可實時捕捉學生情緒變化，並根據情緒輪提供個性化回饋。實務上可先在小規模課程中部署，利用學生互動數據調整獎勵函數，確保模型輸出與教學目標一致。此框架亦可擴展至情緒導向的自適應學習，透過即時情緒辨識調整難度或提供情緒支持，提升學習動機與成效。

原始文獻資訊

英文標題：: AffectGPT-RL: Revealing Roles of Reinforcement Learning in Open-Vocabulary Emotion Recognition
作者：: Zheng Lian, Fan Zhang, Lan Chen, Yazhou Zhang, Rui Liu, Jinyang Wu, Haoyu Chen, Xiaobai Li, Xiaojiang Peng, Bin He, Jianhua Tao
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。