ai edtech assessment higher education learning design

利用大型語言模型進行封閉式問卷回覆的模擬生成

arXiv - Computers and SocietyGeorg Ahnert, Anna-Carolina Haensch, Barbara Plank, Markus Strohmaier2026年4月27日

系統評估八種生成方法對模擬問卷回覆的影響，發現限制式生成最能提升個人及子群體的對齊度，推論輸出並非一致改善結果。

AI 幫你先抓重點

AI 重點 1

限制式生成方法是模擬問卷回覆的首選策略。

滑鼠懸停看 AI 判斷理由

此發現強調在設計模擬問卷時，採用限制式生成可最大化回覆與實際受訪者行為的一致性，對於需要高精度數據的政策評估與教育研究尤為重要。

AI 重點 2

推理輸出並非提升模擬品質的萬能工具。

滑鼠懸停看 AI 判斷理由

研究顯示推理輸出不一定帶來更好對齊，提醒實務者在選擇生成策略時需考慮模型複雜度與實際效益，避免不必要的計算成本。

核心研究發現

1
在32萬個模擬回覆中，八種生成方法在個人層面與子群體層面對齊度上存在顯著差異。
2
限制式生成方法在整體對齊度上表現最佳，顯示其能更準確模擬真實受訪者回覆。
3
加入推理輸出並未持續提升對齊度，甚至在某些情況下降低了模擬品質。

對教育工作者的啟發

1. 在進行問卷回覆模擬時，優先採用限制式生成方法，可提升個人與子群體對齊度，確保模擬數據的可靠性。2. 若需加入推理輸出，應先驗證其對特定問卷的實際效益，避免因推理複雜度增加而降低整體對齊度。3. 建議在選擇語言模型時，考量模型的開放權重與訓練資料，因不同模型對生成結果的影響可能不同。4. 對於需要快速迭代的教育評量或政策模擬，可先使用限制式方法作為基線，再根據需求調整推理或其他生成策略。5. 研究者與實務者可依此研究提供的實驗設計與評估指標，建立自己的生成方法比較框架，持續優化模擬問卷的質量。

原始文獻資訊

英文標題：: Survey Response Generation: Generating Closed-Ended Survey Responses In-Silico with Large Language Models
作者：: Georg Ahnert, Anna-Carolina Haensch, Barbara Plank, Markus Strohmaier
來源：: arXiv - Computers and Society
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。