edtech ai srl metacognition learning design

MindMirror：面向數位工作者的本地化多模態狀態感知支援系統

arXiv - Human-Computer InteractionWenqi Luo, Changbo Wang, Yan Wang2026年5月13日

提出一套本地化、結合臉部表情、文字、語音的多模態支援系統，協助數位工作者自我反思與提升工作效率。

AI 幫你先抓重點

AI 重點 1

本地化設計降低資料外泄風險，提升用戶隱私與信任。

滑鼠懸停看 AI 判斷理由

在教育科技與工作環境中，資料隱私是關鍵考量。將所有處理與存儲保留於本機，可避免雲端傳輸帶來的安全漏洞，讓使用者更願意分享真實情緒與工作狀態，進而提升系統效能。

AI 重點 2

結合臉部表情與文字的多模態輸入，能更精準捕捉工作者情緒，提供個性化建議。

滑鼠懸停看 AI 判斷理由

單一模態往往無法完整反映使用者內在狀態。多模態感知可交叉驗證，減少誤判，並為大模型生成更貼近實際需求的回應，進一步促進自我調節與學習成效。

核心研究發現

1
情緒辨識模型經微調後，在七類臉部表情基準上準確率從 59.66% 提升至 94.49%，提升幅度 34.83pp。
2
透過端點可靠性測試、語音延遲測試與六位數位工作者的使用者體驗調查，發現使用者高度評價本地化設計、手動校正機制與結構化反思工作流程。
3
系統架構包含 Web 前端、Flask 後端、情緒辨識模型、Ollama 服務的 Qwen LLM、Chart.js 視覺化以及本地 JSON/LocalStorage 記錄，語音互動可選擇第三方 API。

對教育工作者的啟發

本研究示範了在本地化環境下結合多模態感知與輕量級 LLM 的可行性。實務工作者可依此設計：1) 先確保所有資料處理皆在本機完成，減少隱私風險；2) 透過臉部表情、文字與語音三種輸入，建立更完整的使用者狀態模型；3) 允許使用者手動校正模型輸出，提升信任度；4) 設計結構化反思工作流程，將情緒與任務阻塞拆解成可操作的反思項目；5) 使用 Chart.js 等簡易視覺化工具，將每日/每週報告呈現給使用者；6) 若需語音互動，可選擇第三方 API，並評估延遲以確保即時性。這些做法不僅能提升工作效率，也能促進自我調節與學習成效，對於需要在高壓環境下維持專注的數位工作者尤為重要。

原始文獻資訊

英文標題：: MindMirror: A Local-First Multimodal State-Aware Support System for Digital Workers
作者：: Wenqi Luo, Changbo Wang, Yan Wang
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。