AI時代的使用者體驗:以統計視角重新思考評估指標
arXiv - Human-Computer InteractionHarish Vijayakumar
提出 ADUX-Stat 框架,將 UX 可用性重新定義為概率分布,並引入互動熵、時間漂移係數與貝葉斯可用性置信分數,以統計方法評估 AI 驅動產品的使用者體驗。
AI 幫你先抓重點
AI 重點 1
AI 建議先關注互動熵指數,因其量化 AI 回應的不確定性,直接影響使用者信任與滿意度。
滑鼠懸停看 AI 判斷理由
互動熵指數將 AI 的隨機輸出轉化為可量化的度量,幫助設計者快速定位不穩定區域,優化對話流與介面回饋,從而提升整體體驗。
AI 重點 2
AI 強調時間漂移係數的重要性,提醒實務者需持續追蹤可用性隨時間的變化,避免長期使用者流失。
滑鼠懸停看 AI 判斷理由
時間漂移係數揭示使用者體驗的長期趨勢,讓設計者能在產品迭代中調整功能或介面,維持或提升使用者黏著度,對於教育平台尤為關鍵。
核心研究發現
- 1
傳統可用性指標(如 SUS、NPS、任務完成率)在 AI 驅動的對話式、生成式與推薦系統中因輸出隨機性與時間變化而結構性不足。
- 2
ADUX-Stat 框架將可用性重新定義為概率信號分布,並引入互動熵指數、時間漂移係數與貝葉斯可用性置信分數三大構造。
- 3
作者以概念驗證方式,將 ADUX-Stat 應用於五類 AI 產品(對話代理、生成介面、推薦引擎等),證明其可行性與可擴展性。
對教育工作者的啟發
實務工作者可先在原有測試流程中加入互動熵指數,透過收集 AI 回應的多樣性數據,計算熵值以評估不確定性。接著使用時間漂移係數追蹤使用者在多次互動中的滿意度變化,發現長期下降趨勢時即進行介面優化。最後,利用貝葉斯可用性置信分數提供可用性質量的可信區間,協助決策者在不確定環境下做出更安全的產品迭代。此方法可直接套用於線上學習平台、聊天機器人或推薦系統,提升學習者的互動體驗與學習成效。
原始文獻資訊
- 英文標題:
- UX in the Age of AI: Rethinking Evaluation Metrics Through a Statistical Lens
- 作者:
- Harish Vijayakumar
- 來源:
- arXiv - Human-Computer Interaction
- AI 摘要模型:
- openai/gpt-oss-20b
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。