基於地標的視線追蹤系統:會話式元校準部署

arXiv - Human-Computer InteractionChenkai Zhang

本研究提出一種輕量級的視線追蹤方法EMC-Gaze,透過會話式元校準,降低校準負擔並提升在不同頭部運動下的追蹤準確度。

AI 幫你先抓重點

AI 重點 1

會話式元校準的創新性

滑鼠懸停看 AI 判斷理由
EMC-Gaze的核心貢獻在於將視線追蹤視為會話式適應,這解決了傳統方法校準負擔大、對頭部運動敏感的問題,對於部署在實際應用場景中至關重要。
AI 重點 2

E(3)-等變圖形編碼器的應用

滑鼠懸停看 AI 判斷理由
利用E(3)-等變的圖形編碼器,能有效捕捉面部地標的幾何資訊,並在不同會話間進行適應,提升了模型的泛化能力和追蹤準確度,值得深入研究。

核心研究發現

  1. 1

    EMC-Gaze結合了E(3)-等變的圖形編碼器、局部眼部幾何、雙眼強調、3D視線方向監督和閉合形式的脊校準器,以提升追蹤效能。

  2. 2

    透過使用兩視角一致性損失,EMC-Gaze有效降低了姿勢洩漏,提升了追蹤的穩定性。

  3. 3

    在100公分距離的固定式互動評估中,EMC-Gaze在9點校準後,RMSE為5.79 +/- 1.81度,優於Elastic Net的6.68 +/- 2.34度。

  4. 4

    EMC-Gaze在靜止頭部查詢上的優勢更為顯著,RMSE為2.92 +/- 0.75度,而Elastic Net為4.45 +/- 0.30度。

  5. 5

    在MPIIFaceGaze上,使用短會話校準的眼部聚焦模型,EMC-Gaze達到8.82 +/- 1.21的追蹤準確度。

對教育工作者的啟發

EMC-Gaze的設計理念,強調輕量化和會話式適應,對於在資源有限的環境中部署視線追蹤系統具有重要意義。教育工作者可以考慮將此技術應用於學習分析,例如追蹤學生在學習材料上的注意力集中程度,並據此調整教學策略。此外,EMC-Gaze的校準過程簡便,降低了使用門檻,使其更易於整合到現有的教育科技平台中。

原始文獻資訊

英文標題:
Deployment-Oriented Session-wise Meta-Calibration for Landmark-Based Webcam Gaze Tracking
作者:
Chenkai Zhang
來源:
arXiv - Human-Computer Interaction
AI 摘要模型:
ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。