ai edtech assessment learning design higher education

AI時代的使用者體驗：以統計視角重新思考評估指標

arXiv - Human-Computer InteractionHarish Vijayakumar2026年5月8日

提出 ADUX-Stat 框架，將 UX 可用性重新定義為概率分布，並引入互動熵、時間漂移係數與貝葉斯可用性置信分數，以統計方法評估 AI 驅動產品的使用者體驗。

AI 幫你先抓重點

AI 重點 1

AI 建議先關注互動熵指數，因其量化 AI 回應的不確定性，直接影響使用者信任與滿意度。

滑鼠懸停看 AI 判斷理由

互動熵指數將 AI 的隨機輸出轉化為可量化的度量，幫助設計者快速定位不穩定區域，優化對話流與介面回饋，從而提升整體體驗。

AI 重點 2

AI 強調時間漂移係數的重要性，提醒實務者需持續追蹤可用性隨時間的變化，避免長期使用者流失。

滑鼠懸停看 AI 判斷理由

時間漂移係數揭示使用者體驗的長期趨勢，讓設計者能在產品迭代中調整功能或介面，維持或提升使用者黏著度，對於教育平台尤為關鍵。

核心研究發現

1
傳統可用性指標（如 SUS、NPS、任務完成率）在 AI 驅動的對話式、生成式與推薦系統中因輸出隨機性與時間變化而結構性不足。
2
ADUX-Stat 框架將可用性重新定義為概率信號分布，並引入互動熵指數、時間漂移係數與貝葉斯可用性置信分數三大構造。
3
作者以概念驗證方式，將 ADUX-Stat 應用於五類 AI 產品（對話代理、生成介面、推薦引擎等），證明其可行性與可擴展性。

對教育工作者的啟發

實務工作者可先在原有測試流程中加入互動熵指數，透過收集 AI 回應的多樣性數據，計算熵值以評估不確定性。接著使用時間漂移係數追蹤使用者在多次互動中的滿意度變化，發現長期下降趨勢時即進行介面優化。最後，利用貝葉斯可用性置信分數提供可用性質量的可信區間，協助決策者在不確定環境下做出更安全的產品迭代。此方法可直接套用於線上學習平台、聊天機器人或推薦系統，提升學習者的互動體驗與學習成效。

原始文獻資訊

英文標題：: UX in the Age of AI: Rethinking Evaluation Metrics Through a Statistical Lens
作者：: Harish Vijayakumar
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。