資訊、教練、關聯、傾聽:審核LLM在照顧者支持角色
arXiv - Computers and SocietyDrishti Goel, Agam Goyal, Veda Duddu, Olivia Pal, Jeongah Lee, Qiuyue Joy Zhong, Violeta J. Rodriguez, Daniel S. Brown, Dong Whi Yoo, Ravi Karkar, Koustuv Saha
探討四種照顧者支持角色對LLM安全與效能的影響
AI 幫你先抓重點
AI 重點 1
角色化提示可系統調整LLM風險與效能
滑鼠懸停看 AI 判斷理由
此發現說明透過明確的支持角色設計,可在不改變模型本身的情況下,調節其在照顧者對話中的安全性與實用性,對於設計安全對話代理至關重要。
AI 重點 2
人類評估揭示安全與實用性之權衡
滑鼠懸停看 AI 判斷理由
研究顯示使用者更偏好有幫助的回應,即使其風險較高,提醒開發者在優化模型時需平衡用戶需求與安全風險,避免單純追求安全而犧牲效能。
核心研究發現
- 1
LLM的支持角色會系統性改變互動風險的頻率與組成。
- 2
人類評估顯示,指令性、資訊導向的角色雖被評為更有幫助與可信,但其風險指標亦較高。
- 3
作者釋出約90,000條角色化回應與風險標註,成為實際情境下安全LLM研究的資源。
對教育工作者的啟發
在設計LLM輔助照顧者對話系統時,先明確定義四種支持角色(資訊、教練、關聯、傾聽),並根據照顧情境選擇最合適的角色。利用人類評估結果調整提示語,平衡安全與實用性;同時可將作者提供的90,000條角色化回應與風險標註作為訓練資料,提升模型對風險的辨識與回應品質。最後,考慮用戶對幫助與信任的偏好,設計可調整的安全閾值,以滿足不同照顧者的需求。
原始文獻資訊
- 英文標題:
- Inform, Coach, Relate, Listen: Auditing LLM Caregiving Support Roles
- 作者:
- Drishti Goel, Agam Goyal, Veda Duddu, Olivia Pal, Jeongah Lee, Qiuyue Joy Zhong, Violeta J. Rodriguez, Daniel S. Brown, Dong Whi Yoo, Ravi Karkar, Koustuv Saha
- 來源:
- arXiv - Computers and Society
- AI 摘要模型:
- openai/gpt-oss-20b
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。