CareGuardAI:臨床安全與幻覺緩解的情境感知多代理守門機制

arXiv - Computers and SocietyElham Nasarian, Abhilash Neog, Kwok-Leung Tsui, Niyousha HosseiniChimeh

提出 CareGuardAI 框架,透過多階段控制與風險評估,確保患者面向 LLM 回覆的臨床安全與事實可靠性。

AI 幫你先抓重點

AI 重點 1

多代理管控與雙重風險評估是確保 LLM 臨床安全的關鍵。

滑鼠懸停看 AI 判斷理由
傳統單一模型往往缺乏上下文感知,易產生不安全或幻覺回覆;CareGuardAI 透過控制代理、受限生成與雙重評估,能在推理時即時修正,顯著提升安全性與可靠性,對醫療 AI 部署具有實質影響。
AI 重點 2

將安全與幻覺評估納入推理流程,可在不犧牲速度的前提下維持高準確度。

滑鼠懸停看 AI 判斷理由
研究顯示即時風險評估不僅降低錯誤率,還能保持平均延遲低於 1 秒,證明在臨床環境中可實際運用,避免因延遲導致的資訊延誤。

核心研究發現

  1. 1

    CareGuardAI 在 PatientSafeBench、MedSafetyBench 與 MedHallu 三大基準上,SRA 與 HRA 低於 2 的回覆率達 92%,顯著高於 GPT‑4o‑mini 的 78%。

  2. 2

    多代理管控流程在推理階段將不安全或幻覺回覆剔除,平均延遲僅 0.8 秒,符合臨床即時回覆需求。

  3. 3

    SRA 與 HRA 兩項評估指標相互獨立,結合使用可將錯誤分類率降低 35%,證明風險基礎評估的有效性。

對教育工作者的啟發

對於醫療 AI 系統開發者而言,CareGuardAI 示範了將風險評估嵌入推理流程的可行性。實務上可先建立 SRA/HRA 評估模組,並設計多代理管控架構,確保回覆在安全閾值內才發布。此方法不僅提升臨床安全,也能在保持即時回覆的同時降低幻覺率。醫療機構可依此框架制定安全審核流程,並透過持續監測評估指標,實現動態風險管理。

原始文獻資訊

英文標題:
CareGuardAI: Context-Aware Multi-Agent Guardrails for Clinical Safety & Hallucination Mitigation in Patient-Facing LLMs
作者:
Elham Nasarian, Abhilash Neog, Kwok-Leung Tsui, Niyousha HosseiniChimeh
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。