GUIDE:理解與協助開放式GUI任務的基準

arXiv - Human-Computer InteractionSaelyne Yang, Jaesang Yu, Yi-Hao Peng, Kevin Qinghong Lin, Jae Won Cho, Yale Song, Juho Kim

本研究提出GUIDE基準,旨在評估AI模型在理解使用者在複雜軟體中操作意圖並提供協助的能力,超越傳統的自動化模式。

AI 幫你先抓重點

AI 重點 1

GUIDE基準的建立與評估。

滑鼠懸停看 AI 判斷理由
此基準為評估AI模型在理解使用者意圖和提供GUI協助方面的能力提供了標準化的框架,有助於推動相關領域的研究發展,並促進更人性化的使用者介面設計。
AI 重點 2

使用者背景資訊的重要性。

滑鼠懸停看 AI 判斷理由
研究發現,提供使用者背景資訊能大幅提升AI模型的協助預測能力,這意味著在設計AI助手時,深入理解使用者目標和上下文至關重要,能有效提升協助的品質和準確性。

核心研究發現

  1. 1

    目前AI模型在開放式GUI任務中,對於行為狀態的辨識準確率僅為44.6%,協助預測的準確率為55.0%,表現仍有改善空間。

  2. 2

    提供使用者背景資訊能顯著提升AI模型的表現,特別是在協助預測方面,準確率可提高高達50.2個百分點。

  3. 3

    GUIDE基準包含120位新手使用者的67.5小時螢幕錄影,涵蓋10種不同的軟體,提供豐富的資料集。

  4. 4

    研究定義了三個任務:行為狀態偵測、意圖預測和協助預測,全面評估模型理解使用者行為的能力。

  5. 5

    傳統的GUI代理人側重於自動化操作,而GUIDE強調理解使用者意圖,以實現更有效的協作關係。

對教育工作者的啟發

此研究提示教育科技設計者,在開發輔助學習軟體的AI助手時,不應僅僅關注操作的自動化,更應注重理解學習者的目標和意圖。透過收集學習者的操作行為、口述思考等資料,並將其納入AI模型的訓練中,可以提升助手的理解能力,提供更個人化、更有效的學習支持。此外,在課程設計中,可以利用類似的GUI分析工具,了解學生在使用學習軟體時遇到的困難,並據此調整教學策略。

原始文獻資訊

英文標題:
GUIDE: A Benchmark for Understanding and Assisting Users in Open-Ended GUI Tasks
作者:
Saelyne Yang, Jaesang Yu, Yi-Hao Peng, Kevin Qinghong Lin, Jae Won Cho, Yale Song, Juho Kim
來源:
arXiv - Human-Computer Interaction
AI 摘要模型:
ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。