ai edtech assessment learning design higher education

跨多任務人機互補研究

arXiv - Human-Computer InteractionYuzheng Xu, Annya Dahmani, Matthew D. Blanchard, Niclas Dern, Edy Nastase, Francesca Bianco, Maja Pavlovic, Sukanya Krishna, Eric Modesitt, Miranda Anna Christ, Arth Singh, Gaia Molinaro, Sikata Bela Sengupta, Jaji Pamarthi, Arjun Menon, Rishub Jain2026年5月7日

探討人機互補在多領域任務中的可行性，發現僅有微幅提升，並指出路由與協助方法的瓶頸。

AI 幫你先抓重點

AI 重點 1

路由與協助設計是人機互補的關鍵瓶頸

滑鼠懸停看 AI 判斷理由

此洞察顯示，提升人機協作效果不在於單純提高人類準確率，而是要先確定何時將任務交給人類，並設計能讓人類有效捕捉 AI 錯誤的協助機制，否則即使人類表現優於 AI，整體效能仍受限。

AI 重點 2

top-2 協助在低信心情境下提升人類準確率，但主要靠接受 AI 建議

滑鼠懸停看 AI 判斷理由

這提醒設計者在開發協助介面時，應強調建議的可驗證性與透明度，避免人類僅被動接受 AI，從而降低對 AI 的過度依賴，並促進更主動的錯誤修正。

核心研究發現

1
混合模型僅提升 0.4pp（AI 69.3% vs 68.9%），因只有 8.9% 項目 AI 錯誤但人類正確，且信心路由無法辨識。
2
在 AI 低信心情況下的 top-2 協助將人類準確率從 28.4% 提升至 38.3%，超過 AI 單獨 37.7%，但主要是因人類接受正確 AI 建議，而非成功覆寫錯誤。
3
兩種 AI 協助方式（top-2 與子任務委派）在長文本推理與詐騙偵測等領域表現不佳，顯示人機互補仍受限於任務複雜度與路由策略。

對教育工作者的啟發

實務工作者可先建立信心門檻機制，將低信心任務路由給人類；同時設計可驗證的協助介面，讓人類能快速辨識 AI 建議的正確性，並提供反饋機制以修正錯誤。針對長文本推理與詐騙偵測等高複雜度任務，可採用分層任務拆解，讓人類負責關鍵判斷，AI 只提供輔助資訊。透過上述策略，可在保持 AI 效率的同時，提升人機協作的整體準確率與可靠性。

原始文獻資訊

英文標題：: Toward Human-AI Complementarity Across Diverse Tasks
作者：: Yuzheng Xu, Annya Dahmani, Matthew D. Blanchard, Niclas Dern, Edy Nastase, Francesca Bianco, Maja Pavlovic, Sukanya Krishna, Eric Modesitt, Miranda Anna Christ, Arth Singh, Gaia Molinaro, Sikata Bela Sengupta, Jaji Pamarthi, Arjun Menon, Rishub Jain
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。