ai edtech learning design metacognition higher education

結構化探索與生成靈活性：Bandit 與 LLM 在個人化健康干預中的實地比較

arXiv - Human-Computer InteractionDominik P. Hofer, Haochen Song, Rania Islambouli, Laura Hawkins, Ananya Bhattacharjee, Meredith Franklin, Joseph Jay Williams, Jan D. Smeddinck2026年3月9日

比較 Bandit 與 LLM 在健康行為干預中的訊息選擇與生成，發現 LLM 更受用戶喜愛但 Bandit 無顯著提升。

AI 幫你先抓重點

AI 重點 1

LLM 生成的健康訊息比固定模板更受使用者青睞，但 Bandit 優化並未帶來額外幫助。

滑鼠懸停看 AI 判斷理由

這揭示了 LLM 在提升使用者參與度方面的潛力，同時也提醒設計者，單純依賴 Bandit 進行 BCT 選擇可能無法達到預期效果。了解這一點，有助於讀者評估不同技術在實際應用中的優劣，並避免不必要的資源投入。

AI 重點 2

LLM 容易集中於單一行為改變技巧，而 Bandit 系統則能強制進行多樣化的探索與利用。

滑鼠懸停看 AI 判斷理由

這點突顯了兩種架構在訊息多樣性上的關鍵差異。對於長期行為改變干預而言，維持訊息的新鮮感與廣度至關重要。了解這一點，能幫助讀者在設計時，針對不同干預目標，選擇或結合更合適的架構，避免使用者產生厭倦感。

核心研究發現

1
LLM 生成訊息被評為比固定模板更有幫助，且在所有 LLM 條件下評分相近。
2
Bandit 優化的 BCT 選擇並未提升用戶感知幫助度，與單純 LLM 相當。
3
無限制 LLM 主要集中於單一 BCT，缺乏多樣性；Bandit 系統則強制進行探索與利用。
4
用戶輸入的上下文被系統承認是提升感知幫助度的關鍵因素。
5
研究提供設計建議，平衡結構化探索與生成自主性，以提升個人化健康行為改變系統效能。

對教育工作者的啟發

本研究顯示，LLM 生成訊息能提升用戶感知幫助度，但若僅依賴 LLM 可能會過度集中於單一行為改變技巧，導致訊息單調。建議在實務設計中採用混合架構：利用 Bandit 進行結構化探索，確保多樣化的 BCT 交付；同時保留 LLM 的生成靈活性，以根據用戶歷史與即時輸入產生個性化訊息。系統應明確回饋用戶輸入，增強互動感與信任度；並設計可調節的探索-利用參數，讓開發者根據干預目標與使用者特徵調整平衡點。最後，透過持續收集使用者回饋與行為數據，實施迭代優化，提升干預效果與使用者黏著度。

原始文獻資訊

英文標題：: Structured Exploration vs. Generative Flexibility: A Field Study Comparing Bandit and LLM Architectures for Personalised Health Behaviour Interventions
作者：: Dominik P. Hofer, Haochen Song, Rania Islambouli, Laura Hawkins, Ananya Bhattacharjee, Meredith Franklin, Joseph Jay Williams, Jan D. Smeddinck
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。