生成式 AI 之病患安全風險評估:FMECA 框架之開發與驗證

arXiv - Computers and SocietyLydie Bednarczyk, Jamil Zaghir, Julien Ehrsam, Maria Tcherepanova, Christian Skalafouris, Karim Gariani, Catherine Geslin, Claire-B\'en\'edicte Rivara, Pascal Bonnabry, Laetitia Gosetto, Richard Dubos, Mina Bjelogrlic, Christophe Gaudet-Blavignac, Christian Lovis

提出並驗證一套 FMECA 框架,用於評估 LLM 生成臨床摘要之病患安全風險。

AI 幫你先抓重點

AI 重點 1

提供結構化風險評估框架,提升 LLM 生成摘要的安全性

滑鼠懸停看 AI 判斷理由
此框架將風險識別從臨時判斷轉為系統化流程,能在臨床 AI 部署前及時發現潛在危害,降低醫療失誤。
AI 重點 2

高可用性與一致性驗證顯示框架實用性,易於醫療團隊與 AI 工程師採用

滑鼠懸停看 AI 判斷理由
證明複雜風險分析可被簡化為易操作工具,促進跨部門協作,提升 AI 在臨床實踐中的安全落地。

核心研究發現

  1. 1

    開發出 14 種失效模式分類,形成完整的 FMECA 框架。

  2. 2

    雙輪評分後,失效模式識別達中度至高度一致,嚴重性與可偵測性評分亦具良好一致性。

  3. 3

    系統可用性評估顯示 SUS 平均 79.2/100,使用者信心高,框架實用性良好。

對教育工作者的啟發

醫療機構可將此 FMECA 框架納入 AI 生成摘要的質量管控流程,先行設定失效模式清單並訓練評審人員;使用 SUS 量表評估工具易用度,確保評分者對風險指標的共識;在實際部署前進行小規模試點,收集使用者回饋以迭代優化。此方法不僅提升摘要安全性,也為 AI 產品上市前的合規審查提供可量化證據,降低醫療事故風險。

原始文獻資訊

英文標題:
Evaluating Patient Safety Risks in Generative AI: Development and Validation of a FMECA Framework for Generated Clinical Content
作者:
Lydie Bednarczyk, Jamil Zaghir, Julien Ehrsam, Maria Tcherepanova, Christian Skalafouris, Karim Gariani, Catherine Geslin, Claire-B\'en\'edicte Rivara, Pascal Bonnabry, Laetitia Gosetto, Richard Dubos, Mina Bjelogrlic, Christophe Gaudet-Blavignac, Christian Lovis
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。