低負擔LLM偏好學習:以自然語言回饋為癱瘓使用者個性化輔助機器人

arXiv - Human-Computer InteractionKeshav Shankar, Dan Ding, Wei Gao

本研究提出利用LLM將自然語言回饋轉為決策樹,低負擔地為癱瘓使用者個性化輔助機器人,並證實其安全與效能。

AI 幫你先抓重點

AI 重點 1

LLM結合職業治療框架的語義解碼機制

滑鼠懸停看 AI 判斷理由
此機制能將模糊的人類語言轉化為具體的物理與心理需求,為機器人行為提供明確且安全的指令,從而實現真正的個性化與安全性。
AI 重點 2

自動化安全驗證「LLM-as-a-Judge」流程

滑鼠懸停看 AI 判斷理由
在部署前自動檢查程式碼結構,確保不存在潛在的安全風險,對於臨床應用的信任度與可行性至關重要。

核心研究發現

  1. 1

    低負擔離線框架可直接將非結構化自然語言回饋轉為決策樹式機器人控制策略。

  2. 2

    LLM以職業治療實務框架為基礎,將主觀反應解碼為具體物理與心理需求。

  3. 3

    自動化 "LLM-as-a-Judge" 可在部署前驗證程式碼結構安全。

  4. 4

    在模擬餐點準備實驗中,該方法顯著降低癱瘓使用者的工作負荷。

  5. 5

    獨立臨床專家確認生成的策略既安全又準確反映使用者偏好。

對教育工作者的啟發

此研究示範了如何利用大型語言模型將使用者自然語言回饋直接轉化為可執行的機器人控制策略,並透過職業治療實務框架確保需求的完整性。實務工作者可依此架構:1) 收集使用者口語回饋並輸入LLM;2) 以OTPF為基礎進行語義解碼,產生物理與心理需求;3) 將需求映射至透明決策樹,形成可追蹤的控制規則;4) 使用自動化安全驗證流程,確保程式碼結構安全;5) 在實際部署前進行臨床專家評估。這種低負擔、離線且安全驗證的流程,能顯著降低使用者的身體與認知負荷,並提升機器人服務的個性化與安全性,對於需要快速迭代與安全驗證的康復機器人開發尤為適用。

原始文獻資訊

英文標題:
Low-Burden LLM-Based Preference Learning: Personalizing Assistive Robots from Natural Language Feedback for Users with Paralysis
作者:
Keshav Shankar, Dan Ding, Wei Gao
來源:
arXiv - Human-Computer Interaction
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。