MindMirror:面向數位工作者的本地化多模態狀態感知支援系統

arXiv - Human-Computer InteractionWenqi Luo, Changbo Wang, Yan Wang

提出一套本地化、結合臉部表情、文字、語音的多模態支援系統,協助數位工作者自我反思與提升工作效率。

AI 幫你先抓重點

AI 重點 1

本地化設計降低資料外泄風險,提升用戶隱私與信任。

滑鼠懸停看 AI 判斷理由
在教育科技與工作環境中,資料隱私是關鍵考量。將所有處理與存儲保留於本機,可避免雲端傳輸帶來的安全漏洞,讓使用者更願意分享真實情緒與工作狀態,進而提升系統效能。
AI 重點 2

結合臉部表情與文字的多模態輸入,能更精準捕捉工作者情緒,提供個性化建議。

滑鼠懸停看 AI 判斷理由
單一模態往往無法完整反映使用者內在狀態。多模態感知可交叉驗證,減少誤判,並為大模型生成更貼近實際需求的回應,進一步促進自我調節與學習成效。

核心研究發現

  1. 1

    情緒辨識模型經微調後,在七類臉部表情基準上準確率從 59.66% 提升至 94.49%,提升幅度 34.83pp。

  2. 2

    透過端點可靠性測試、語音延遲測試與六位數位工作者的使用者體驗調查,發現使用者高度評價本地化設計、手動校正機制與結構化反思工作流程。

  3. 3

    系統架構包含 Web 前端、Flask 後端、情緒辨識模型、Ollama 服務的 Qwen LLM、Chart.js 視覺化以及本地 JSON/LocalStorage 記錄,語音互動可選擇第三方 API。

對教育工作者的啟發

本研究示範了在本地化環境下結合多模態感知與輕量級 LLM 的可行性。實務工作者可依此設計:1) 先確保所有資料處理皆在本機完成,減少隱私風險;2) 透過臉部表情、文字與語音三種輸入,建立更完整的使用者狀態模型;3) 允許使用者手動校正模型輸出,提升信任度;4) 設計結構化反思工作流程,將情緒與任務阻塞拆解成可操作的反思項目;5) 使用 Chart.js 等簡易視覺化工具,將每日/每週報告呈現給使用者;6) 若需語音互動,可選擇第三方 API,並評估延遲以確保即時性。這些做法不僅能提升工作效率,也能促進自我調節與學習成效,對於需要在高壓環境下維持專注的數位工作者尤為重要。

原始文獻資訊

英文標題:
MindMirror: A Local-First Multimodal State-Aware Support System for Digital Workers
作者:
Wenqi Luo, Changbo Wang, Yan Wang
來源:
arXiv - Human-Computer Interaction
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。