AI時代的使用者體驗:以統計視角重新思考評估指標

arXiv - Human-Computer InteractionHarish Vijayakumar

提出 ADUX-Stat 框架,將 UX 可用性重新定義為概率分布,並引入互動熵、時間漂移係數與貝葉斯可用性置信分數,以統計方法評估 AI 驅動產品的使用者體驗。

AI 幫你先抓重點

AI 重點 1

AI 建議先關注互動熵指數,因其量化 AI 回應的不確定性,直接影響使用者信任與滿意度。

滑鼠懸停看 AI 判斷理由
互動熵指數將 AI 的隨機輸出轉化為可量化的度量,幫助設計者快速定位不穩定區域,優化對話流與介面回饋,從而提升整體體驗。
AI 重點 2

AI 強調時間漂移係數的重要性,提醒實務者需持續追蹤可用性隨時間的變化,避免長期使用者流失。

滑鼠懸停看 AI 判斷理由
時間漂移係數揭示使用者體驗的長期趨勢,讓設計者能在產品迭代中調整功能或介面,維持或提升使用者黏著度,對於教育平台尤為關鍵。

核心研究發現

  1. 1

    傳統可用性指標(如 SUS、NPS、任務完成率)在 AI 驅動的對話式、生成式與推薦系統中因輸出隨機性與時間變化而結構性不足。

  2. 2

    ADUX-Stat 框架將可用性重新定義為概率信號分布,並引入互動熵指數、時間漂移係數與貝葉斯可用性置信分數三大構造。

  3. 3

    作者以概念驗證方式,將 ADUX-Stat 應用於五類 AI 產品(對話代理、生成介面、推薦引擎等),證明其可行性與可擴展性。

對教育工作者的啟發

實務工作者可先在原有測試流程中加入互動熵指數,透過收集 AI 回應的多樣性數據,計算熵值以評估不確定性。接著使用時間漂移係數追蹤使用者在多次互動中的滿意度變化,發現長期下降趨勢時即進行介面優化。最後,利用貝葉斯可用性置信分數提供可用性質量的可信區間,協助決策者在不確定環境下做出更安全的產品迭代。此方法可直接套用於線上學習平台、聊天機器人或推薦系統,提升學習者的互動體驗與學習成效。

原始文獻資訊

英文標題:
UX in the Age of AI: Rethinking Evaluation Metrics Through a Statistical Lens
作者:
Harish Vijayakumar
來源:
arXiv - Human-Computer Interaction
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。