ai learning analytics healthcare simulation edtech assessment

醫療模擬中可擴展的 LLM 對話編碼研究：平衡準確度、處理速度與環境影響

arXiv - Computers and SocietyKiyoshige Garces, Gloria Milena Fernandez-Nieto, Linxuan Zhao, Sachini Samaraweera, Dragan Gasevic, Roberto Martinez-Maldonado, Vanessa Echeverria2026年4月28日

本研究探討如何透過優化提示設計與批次處理策略，在醫療模擬對話分析中取得準確度、速度與永續性的最佳平衡。

AI 幫你先抓重點

AI 重點 1

從「追求極致準確」轉向「追求實務平衡」的範式轉移

滑鼠懸停看 AI 判斷理由

過去研究多專注於 LLM 是否能達到人類編碼的準確度，但本研究提醒教育實務者，在需要即時回饋的場景中，速度與環境成本同樣是不可忽視的關鍵維度。

AI 重點 2

對話分析的永續性與計算成本考量

滑鼠懸停看 AI 判斷理由

隨著 AI 應用擴大，大規模的對話分析會帶來顯著的能源消耗。將環境影響納入教育科技設計的考量，對於推動可持續發展的數位學習環境至關重要。

核心研究發現

1
研究發現增加批次處理大小（Batch Size）能有效提升處理速度並降低能源消耗，但會對對話編碼的準確性產生負面影響。
2
透過對 11,647 條語句進行測試，研究證實了 LLM 在自動化對話分析中的可行性，能處理六種不同的對話構念。
3
研究揭示了在即時教育情境（如醫療模擬回饋）中，編碼性能、處理時間與計算成本之間存在明顯的權衡關係。

對教育工作者的啟發

對於設計即時回饋系統的教育工作者，建議不要盲目追求最高精度的 LLM 模型，而應根據教學情境選擇「適度準確」的策略。例如，在需要即時進行模擬回饋（Debriefing）時，應優先考慮能快速產出結果且能源消耗較低的批次處理模式；而在進行長期、非即時的學習研究時，則應優先選擇高精度的提示設計。此外，開發者應將「處理延遲」與「環境成本」納入評估教育工具效能的指標中。

原始文獻資訊

英文標題：: Scalable LLM-based Coding of Dialogue in Healthcare Simulation: Balancing Coding Performance, Processing Time, and Environmental Impact
作者：: Kiyoshige Garces, Gloria Milena Fernandez-Nieto, Linxuan Zhao, Sachini Samaraweera, Dragan Gasevic, Roberto Martinez-Maldonado, Vanessa Echeverria
來源：: arXiv - Computers and Society
AI 摘要模型：: /models/gemma-4-26B-A4B-it

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。