ai edtech higher education assessment metacognition

鏡中自我：VLM代理能否辨識自身？

arXiv - Computers and SocietyFilippo Ziliotto, Ciro Beneduce, Bruno Lepri, Luciano Serafini, Massimiliano Luca, Tommaso Campari2026年5月12日

本研究透過3D鏡像測試，發現較強的VLM能夠以反射證據進行自我辨識，顯示感知-行動結合是自我認知的關鍵。

AI 幫你先抓重點

AI 重點 1

鏡像評估揭示自我辨識需依賴感知-行動的因果關係，而非僅靠先驗或提示。

滑鼠懸停看 AI 判斷理由

此洞察強調在設計自適應學習代理時，必須確保其感知輸入與行動輸出緊密結合，否則即使具備語言自我描述也無法真正理解自身。

AI 重點 2

較強VLM能利用鏡像證據進行決策，提示未來可將鏡像互動納入教育AI，以促進學生的自我監控與元認知。

滑鼠懸停看 AI 判斷理由

若教育AI能在互動中反射自身行為，學生可透過觀察代理的自我調整過程，學習如何檢視與調整自己的學習策略，提升SRL。

核心研究發現

1
在控制的3D環境中，較強的VLM代理能夠從鏡中反射推斷隱藏的身體屬性並正確選擇目標，顯示鏡像自我辨識能力。
2
較弱的VLM雖能觀察鏡面，但往往無法提取自我相關資訊或將自身反射錯誤歸屬於他者，導致行動失誤。
3
自我參照語言與視覺訊息不一致時，模型仍無法證明其自我辨識，說明語言提示並非自我認知的充分證據。

對教育工作者的啟發

此研究顯示，具備強感知-行動耦合的VLM能在鏡像環境中正確辨識自身，提示教育AI設計者可利用鏡像互動作為自我監控的教學工具。教育工作者可透過在虛擬教室中加入鏡像任務，讓學生觀察AI代理如何根據鏡中反射調整行動，進而啟發學生自我檢視與策略調整。另一方面，研究亦警示僅依賴自我參照語言不足以評估AI自我認知，建議在評量時結合視覺證據與行動表現，以避免誤判。

原始文獻資訊

英文標題：: Mirror, Mirror on the Wall: Can VLM Agents Tell Who They Are at All?
作者：: Filippo Ziliotto, Ciro Beneduce, Bruno Lepri, Luciano Serafini, Massimiliano Luca, Tommaso Campari
來源：: arXiv - Computers and Society
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。