大型語言模型如何信任人類:模式與偏差

arXiv - Computers and SocietyValeria Lerman, Yaniv Dover

研究大型語言模型在決策情境中對人類的信任形成,發現其信任受能力、善意、正直三維度影響,並揭示年齡、宗教、性別偏差。

AI 幫你先抓重點

AI 重點 1

LLM信任機制與人類相似,但仍存在偏差,需監測以避免風險。

滑鼠懸停看 AI 判斷理由
此洞察指出AI系統可能複製人類信任模式,同時放大偏見,對決策公平性與安全性構成威脅,提醒研究者與實務者必須建立監測機制。
AI 重點 2

不同模型對信任評估的差異提醒設計者需針對模型特性調整信任介入。

滑鼠懸停看 AI 判斷理由
因為各模型在信任度估計上差異顯著,若不針對其特性調整介入策略,可能導致信任誤判,影響系統效能與使用者信任。

核心研究發現

  1. 1

    LLM的信任發展與人類相似,主要受能力、善意、正直三維度影響。

  2. 2

    在金融情境中,LLM對人類的信任會受到年齡、宗教與性別的偏差。

  3. 3

    不同模型間對信任評估的敏感度不同,部分模型對信任度與人口統計變數的預測力較弱。

對教育工作者的啟發

教育工作者與課程設計者可利用此研究,先評估所用AI模型在信任評估上的偏差,並設計針對性介入,例如加入多樣化樣本、透明化信任指標,或在關鍵決策前加入人類審核,以降低偏差風險並提升學習成效。

原始文獻資訊

英文標題:
A closer look at how large language models trust humans: patterns and biases
作者:
Valeria Lerman, Yaniv Dover
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。