大型語言模型如何信任人類：模式與偏差

arXiv - Computers and SocietyValeria Lerman, Yaniv Dover2026年4月16日

研究大型語言模型在決策情境中對人類的信任形成，發現其信任受能力、善意、正直三維度影響，並揭示年齡、宗教、性別偏差。

AI 幫你先抓重點

AI 重點 1

LLM信任機制與人類相似，但仍存在偏差，需監測以避免風險。

滑鼠懸停看 AI 判斷理由

此洞察指出AI系統可能複製人類信任模式，同時放大偏見，對決策公平性與安全性構成威脅，提醒研究者與實務者必須建立監測機制。

AI 重點 2

不同模型對信任評估的差異提醒設計者需針對模型特性調整信任介入。

滑鼠懸停看 AI 判斷理由

因為各模型在信任度估計上差異顯著，若不針對其特性調整介入策略，可能導致信任誤判，影響系統效能與使用者信任。

教育工作者與課程設計者可利用此研究，先評估所用AI模型在信任評估上的偏差，並設計針對性介入，例如加入多樣化樣本、透明化信任指標，或在關鍵決策前加入人類審核，以降低偏差風險並提升學習成效。

英文標題：: A closer look at how large language models trust humans: patterns and biases
作者：: Valeria Lerman, Yaniv Dover
來源：: arXiv - Computers and Society
AI 摘要模型：: openai/gpt-oss-20b

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。