偵測學生直接貼上LLM回覆的作業偽造

arXiv - Computers and SocietyAizierjiang Aiersilan

提出一種輸入端隱藏水印技術,透過Unicode標籤嵌入指令,讓LLM在回覆中留下可辨識簽名,從而偵測學生直接貼上模型回覆的行為。

AI 幫你先抓重點

AI 重點 1

輸入端水印不需模型提供者協作,教師即可自行控制偵測機制。

滑鼠懸停看 AI 判斷理由
此方法將偵測責任轉移到教師端,避免依賴模型供應商的輸出水印,降低實施門檻並提升偵測可靠性,對於多語言環境下的公平評量尤為重要。
AI 重點 2

使用已棄用的Unicode Tags區塊確保水印不可見且跨平台持久,避免被人為刪除或格式化破壞。

滑鼠懸停看 AI 判斷理由
該區塊在大多數文字處理器中被忽略,且不影響內容顯示,保證即使在不同文件格式轉換後仍能保留隱藏訊息,從而提升偵測的穩定性與可擴展性。

核心研究發現

  1. 1

    利用已棄用的Unicode Tags區塊(U+E0000–U+E007F)將任意ASCII負載編碼進作業提示,編碼後文字在視覺上與原始提示完全相同。

  2. 2

    該編碼能在Word、Google Docs、PDF、Markdown、Slack、電子郵件及主流學習管理系統等多種複製粘貼渠道中保持完整,且被前沿LLM正確分詞。

  3. 3

    在七個主流LLM族群(如GPT‑4、Claude、Gemini等)及多種教育內容渠道上測試,模型能讀取隱藏指令並在回覆中寫入可辨識簽名,證明方法的可行性與普適性。

對教育工作者的啟發

教師可利用SteganoPrompt將隱藏指令嵌入作業提示,確保學生在使用LLM時必須閱讀並在回覆中留下簽名,從而快速辨識直接貼上行為。實務上,建議先在課堂測試不同文字處理器與學習管理系統,確認水印不被刪除;將簽名格式化為易於自動比對的標記;並在評分流程中加入自動化檢查腳本,減少人工審查負擔。此方法不需改動模型或平台,成本低且可即時部署,對於多語言與非英語使用者的公平評量亦具備優勢。

原始文獻資訊

英文標題:
Detecting Verbatim LLM Copy-Paste in Homework
作者:
Aizierjiang Aiersilan
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。