EMSDialog:利用多LLM代理從電子病歷生成多方急救對話

arXiv - Computation and LanguageXueren Ge, Sahil Murtaza, Anthony Cortez, Homa Alemzadeh

開發多代理生成管線,產出4,414條真實感高的多方急救對話,並證實可提升診斷預測效能

AI 幫你先抓重點

AI 重點 1

多代理生成管線結合規則檢查,可大規模產生高真實感的多方醫療對話,解決資料稀缺問題。

滑鼠懸停看 AI 判斷理由
此方法提供可重複、可擴充的合成資料生成流程,對於需要多方互動的醫療對話系統開發與教育模擬具有重要價值,能降低實際收集成本並提升模型泛化能力。
AI 重點 2

使用合成資料增強訓練能顯著提升診斷預測的準確率、時效性與穩定性,證明合成資料可有效彌補真實資料不足。

滑鼠懸停看 AI 判斷理由
這一發現顯示合成對話不僅能補足資料量,還能提升模型在實際場景中的表現,為醫療 AI 研發者提供實用的資料增強策略。

核心研究發現

  1. 1

    管線結合多LLM代理與規則檢查,產生4,414條多方急救對話,涵蓋43種診斷、說話者角色與回合主題。

  2. 2

    人類與LLM評估顯示對話在語句與整體層級上均達高品質與真實感,評分指標顯示與真實對話相近。

  3. 3

    將EMSDialog加入模型訓練後,對話式診斷預測的準確率、時效性與穩定性均有顯著提升。

對教育工作者的啟發

對於醫療教育工作者,可利用EMSDialog作為模擬急救情境,設計多方角色扮演,提升學生實務判斷與溝通技巧;對於課程設計者,可將合成對話嵌入案例分析與互動式學習模組;對於 AI 開發者,可採用多LLM代理管線快速產生高品質對話資料,並以此增強對話式診斷模型;對於政策制定者,可考慮將合成資料納入訓練標準,以降低實際資料收集成本並保障隱私。

原始文獻資訊

英文標題:
EMSDialog: Synthetic Multi-person Emergency Medical Service Dialogue Generation from Electronic Patient Care Reports via Multi-LLM Agents
作者:
Xueren Ge, Sahil Murtaza, Anthony Cortez, Homa Alemzadeh
來源:
arXiv - Computation and Language
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。