偵測學生直接貼上LLM回覆的作業偽造
arXiv - Computers and SocietyAizierjiang Aiersilan
提出一種輸入端隱藏水印技術,透過Unicode標籤嵌入指令,讓LLM在回覆中留下可辨識簽名,從而偵測學生直接貼上模型回覆的行為。
AI 幫你先抓重點
AI 重點 1
輸入端水印不需模型提供者協作,教師即可自行控制偵測機制。
滑鼠懸停看 AI 判斷理由
此方法將偵測責任轉移到教師端,避免依賴模型供應商的輸出水印,降低實施門檻並提升偵測可靠性,對於多語言環境下的公平評量尤為重要。
AI 重點 2
使用已棄用的Unicode Tags區塊確保水印不可見且跨平台持久,避免被人為刪除或格式化破壞。
滑鼠懸停看 AI 判斷理由
該區塊在大多數文字處理器中被忽略,且不影響內容顯示,保證即使在不同文件格式轉換後仍能保留隱藏訊息,從而提升偵測的穩定性與可擴展性。
核心研究發現
- 1
利用已棄用的Unicode Tags區塊(U+E0000–U+E007F)將任意ASCII負載編碼進作業提示,編碼後文字在視覺上與原始提示完全相同。
- 2
該編碼能在Word、Google Docs、PDF、Markdown、Slack、電子郵件及主流學習管理系統等多種複製粘貼渠道中保持完整,且被前沿LLM正確分詞。
- 3
在七個主流LLM族群(如GPT‑4、Claude、Gemini等)及多種教育內容渠道上測試,模型能讀取隱藏指令並在回覆中寫入可辨識簽名,證明方法的可行性與普適性。
對教育工作者的啟發
教師可利用SteganoPrompt將隱藏指令嵌入作業提示,確保學生在使用LLM時必須閱讀並在回覆中留下簽名,從而快速辨識直接貼上行為。實務上,建議先在課堂測試不同文字處理器與學習管理系統,確認水印不被刪除;將簽名格式化為易於自動比對的標記;並在評分流程中加入自動化檢查腳本,減少人工審查負擔。此方法不需改動模型或平台,成本低且可即時部署,對於多語言與非英語使用者的公平評量亦具備優勢。
原始文獻資訊
- 英文標題:
- Detecting Verbatim LLM Copy-Paste in Homework
- 作者:
- Aizierjiang Aiersilan
- 來源:
- arXiv - Computers and Society
- AI 摘要模型:
- openai/gpt-oss-20b
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。