AlignMamba-2：模態感知 Mamba 提升多模態融合與情感分析

arXiv - Artificial IntelligenceYan Li, Yifei Xing, Xiangyuan Lan, Xin Li, Haifeng Chen, Dongmei Jiang2026年3月21日

本文提出 AlignMamba-2，一種利用雙重對齊策略和模態感知 Mamba 層，提升多模態融合與情感分析效率和精準度的框架。

AI 幫你先抓重點

AI 重點 1

模態感知 Mamba 層的設計與應用。

滑鼠懸停看 AI 判斷理由

此設計針對多模態資料的異質性問題，提供了一種有效的解決方案，能顯著提升模型在融合不同模態資料時的表現，對於未來多模態學習的研究具有重要參考價值。

AI 重點 2

雙重對齊策略的有效性。

滑鼠懸停看 AI 判斷理由

透過 Optimal Transport 距離和 Maximum Mean Discrepancy 的結合，AlignMamba-2 能夠在不增加推理成本的情況下，提升模態間的一致性，這對於提升情感分析的準確性至關重要。

1
AlignMamba-2 透過 Optimal Transport 距離和 Maximum Mean Discrepancy 進行雙重對齊，提升模態間的幾何和統計一致性，無需增加推理時間。
2
模態感知 Mamba 層採用混合專家架構，包含模態特定和模態共享專家，有效處理多模態資料的異質性。
3
AlignMamba-2 在動態時間序列資料集（CMU-MOSI、CMU-MOSEI）和靜態圖像資料集（NYU-Depth V2、MVSA-）上展現卓越效能。
4
Mamba 模型相較於 Transformer 模型，在處理長序列資料時具有更佳的計算效率，能有效解決傳統 Transformer 的計算複雜度問題。
5
研究結果表明，AlignMamba-2 能夠在保持計算效率的同時，提升多模態情感分析的準確性，為相關領域提供新的解決方案。

AlignMamba-2 的設計理念，例如模態感知和雙重對齊，可應用於其他多模態學習任務，提升模型在處理異質資料時的效能。教育科技領域可藉此提升學生情感分析的準確性，進而提供更個人化的學習體驗。此外，其高效的計算能力也使其適合部署在資源有限的環境中，例如行動裝置。

英文標題：: AlignMamba-2: Enhancing Multimodal Fusion and Sentiment Analysis with Modality-Aware Mamba
作者：: Yan Li, Yifei Xing, Xiangyuan Lan, Xin Li, Haifeng Chen, Dongmei Jiang
來源：: arXiv - Artificial Intelligence
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。