ai edtech higher education learning design srl

PersonaTeaming：支援以角色為導向的紅隊測試生成式 AI

arXiv - Computers and SocietyWesley Hanwen Deng, Mingxi Yan, Sunnie S. Y. Kim, Akshita Jha, Lauren Wilcox, Kenneth Holstein, Motahhare Eslami, Leon A. Gatys2026年5月8日

開發 PersonaTeaming 以角色驅動紅隊測試，提升自動化攻擊成功率並提供人機協作平台。

AI 幫你先抓重點

AI 重點 1

角色驅動紅隊測試能顯著提升自動化攻擊成功率，並保持提示多樣性，提供更真實的風險評估。

滑鼠懸停看 AI 判斷理由

此發現說明將人類角色融入自動化紅隊能彌補純算法的局限，產生更具代表性的威脅場景，對 AI 安全設計與測試流程具有實質影響。

AI 重點 2

人機協作平台讓實務者自行創建角色並與 AI 共同演化提示，促進創新思維並提升對不同使用者情境的適應性。

滑鼠懸停看 AI 判斷理由

此平台使安全從業者能以角色為基礎快速迭代提示，降低學習曲線並鼓勵多元策略，對持續安全評估與 AI 系統的韌性提升至關重要。

核心研究發現

1
PersonaTeaming Workflow 在攻擊成功率上優於 RainbowPlus，且保持提示多樣性。
2
PersonaTeaming Playground 讓 11 位產業實務者產出多元紅隊策略，並被視為實用。
3
AI 生成的建議雖未被完全採用，但仍促進了參與者的創新思維與策略多樣化。

對教育工作者的啟發

教育工作者可利用 PersonaTeaming Playground 讓學生扮演不同角色，進行紅隊模擬，培養批判性思維與創新策略；同時，企業可將此平台納入安全培訓，促進人機協作與快速迭代提示。

原始文獻資訊

英文標題：: PersonaTeaming: Supporting Persona-Driven Red-Teaming for Generative AI
作者：: Wesley Hanwen Deng, Mingxi Yan, Sunnie S. Y. Kim, Akshita Jha, Lauren Wilcox, Kenneth Holstein, Motahhare Eslami, Leon A. Gatys
來源：: arXiv - Computers and Society
AI 摘要模型：: openai/gpt-oss-20b

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。