SWAN:使用抽象語義表示的語義水印

arXiv - Computers and SocietyZiping Ye, Gourab Dey, Christos Christodoulopoulos, Charith Peris, Anil Ramakrishna, Weitong Ruan, Aram Galstyan, Kai-Wei Chang, Rahul Gupta, Ninareh Mehrabi

SWAN透過抽象語義表示將水印嵌入句子語義結構,提升在意義保持的改寫下的偵測魯棒性。

AI 幫你先抓重點

AI 重點 1

將水印嵌入語義結構而非字元層面,可在改寫後仍保持可偵測性。

滑鼠懸停看 AI 判斷理由
此洞察顯示從字元級到語義級的轉變,能在實際改寫情境中維持水印可偵測性,對AI生成內容審核與學術誠信具有關鍵意義。
AI 重點 2

SWAN的訓練免費、提示式設計降低實作門檻,易於在現有LLM平台部署。

滑鼠懸停看 AI 判斷理由
不需微調且依賴提示工程,使實務工作者能快速將水印功能整合至現有內容創作或審核流程,促進教育科技產品的快速迭代與應用。

核心研究發現

  1. 1

    SWAN將水印簽名直接嵌入句子抽象語義表示(AMR),使任何保持意義的改寫都能自動保留水印。

  2. 2

    此方法無需訓練,透過提示LLM以選定AMR模板生成句子,偵測則使用現成AMR解析器與簡單比例z檢定。

  3. 3

    在RealNews基準上,SWAN在未改寫文本的偵測性能與最先進方法相當,且對改寫的魯棒性提升最高13.9% AUC。

對教育工作者的啟發

教育內容創作者可採用SWAN將水印嵌入教材或作業,確保內容來源可追蹤。開發者可在生成式AI平台加入AMR模板提示,並使用公開AMR解析器進行偵測,降低技術門檻。學術機構可將此技術納入抄襲檢測系統,提升對改寫文本的偵測準確度。實務上,建議先在小規模教材上測試水印AUC,確保不影響語義流暢,再擴大至全校級別。

原始文獻資訊

英文標題:
SWAN: Semantic Watermarking with Abstract Meaning Representation
作者:
Ziping Ye, Gourab Dey, Christos Christodoulopoulos, Charith Peris, Anil Ramakrishna, Weitong Ruan, Aram Galstyan, Kai-Wei Chang, Rahul Gupta, Ninareh Mehrabi
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。