ai edtech higher education learning design knowledge building

多代理強化學習於行人行為不確定性下的安全自動駕駛

arXiv - Human-Computer InteractionPrakash Aryan, Kaushik Raghupathruni, Timo Kehrer, Sebastiano Panichella2026年5月21日

透過多代理強化學習同時訓練行人與自駕車，可生成更真實的互動情境，顯著降低碰撞率並提升目標達成率。

AI 幫你先抓重點

AI 重點 1

多代理訓練能讓行人行為更具多樣性與不確定性，提升安全評估的真實性。

滑鼠懸停看 AI 判斷理由

此洞察顯示加入隱藏性格參數與動態決策可產生更真實的互動場景，幫助驗證自駕車演算法並為政策制定提供更可靠的數據。

AI 重點 2

速度差異指標揭示自駕車對閃避行人缺乏預測，提示需要更先進的感知與預測模型。

滑鼠懸停看 AI 判斷理由

了解此速度差距對於改進感知系統、預測不可預測人類行為至關重要，直接影響安全性與實際部署效能。

核心研究發現

1
共同訓練的自駕車在 500 次評估中達到 78% 目標完成率，碰撞率 14%，遠優於最佳基準 35% 目標完成率與 33% 碰撞率。
2
速度差異指標顯示自駕車在靠近行人時平均速度比在人行道上快 2.65 m/s，說明對閃避行人未做預測。
3
共同訓練減少 30% 碰撞率，因行人學會在自駕車接近時等待，尤其在 13% 的闖紅燈事件中佔 62% 碰撞。

對教育工作者的啟發

實務工作者可先在仿真平台搭建多代理環境，將行人行為拆分為路徑規劃與高階決策兩層，並為每位行人隨機抽取隱藏性格參數，讓模型學習在不同情境下的等待或闖紅燈行為。評估時加入速度差異指標，可快速定位自駕車對不可預測行人缺乏預測的區域，進而調整感知閾值或加入預測模組。此方法不僅提升碰撞率指標，亦能為安全評估報告提供更具說服力的數據。

原始文獻資訊

英文標題：: Multi-Agent Reinforcement Learning for Safe Autonomous Driving Under Pedestrian Behavioral Uncertainty
作者：: Prakash Aryan, Kaushik Raghupathruni, Timo Kehrer, Sebastiano Panichella
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。