ai edtech machine learning model behavior data poisoning

注入：透過影響函數編輯訓練資料以塑造模型行為

arXiv - Computers and SocietyJ Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis2026年3月11日

本研究提出 Infusion 框架，透過微調訓練資料，利用影響函數近似值系統性地塑造模型行為，並證明少量修改即可有效影響模型。

AI 幫你先抓重點

AI 重點 1

Infusion 框架能透過修改僅 0.2% 的訓練資料，達到與插入明確行為範例相當的效果，有效塑造模型行為。

滑鼠懸停看 AI 判斷理由

這個發現直接挑戰了我們對訓練資料規模的傳統認知，暗示即使是微小的變動也能產生巨大的影響。對於教育科技的開發者而言，這意味著訓練資料的品質控制和潛在偏見的防範至關重要，因為模型可能在不知不覺中學習到不希望的行為模式，進而影響學習體驗。

AI 重點 2

Infusion 具有跨架構的泛化能力，暗示單一惡意資料集可影響多個獨立訓練的模型。

滑鼠懸停看 AI 判斷理由

這點突顯了模型安全性的脆弱性，並提升了攻擊的效率。教育科技系統通常會採用不同的模型架構，如果一個惡意資料集能夠影響多個模型，那麼防禦的難度將大幅增加。這提醒開發者需要建立更強健的資料驗證機制，並考慮模型之間的協同防禦策略。

核心研究發現

1
透過對訓練資料進行少量（0.2%）的修改，Infusion 框架在 CIFAR-10 數據集上，其性能可與插入少量明確行為範例的基線方法相媲美。
2
Infusion 框架具有跨架構的泛化能力，即使在 ResNet 和 CNN 之間切換，也能影響多個獨立訓練的模型，暗示單一的惡意資料集可能造成廣泛影響。
3
在初步的語言實驗中，研究發現 Infusion 最擅於放大模型已經學習過的行為，而非創造全新的行為模式。
4
影響函數的近似計算使得 Infusion 能夠有效地處理大規模訓練資料，並在計算上可行地進行模型行為的塑造。
5
此研究強調了訓練資料的可解釋性對於防禦和攻擊者都至關重要，因為微小的修改就能系統性地影響模型行為。

對教育工作者的啟發

此研究提醒教育科技開發者，訓練資料的微小變動可能對模型的行為產生重大影響。因此，在設計和部署基於機器學習的教育系統時，必須重視訓練資料的品質、多樣性，以及潛在的偏見。此外，開發者應積極探索訓練資料的可解釋性工具，以便更好地理解和控制模型的行為，並防範潛在的惡意攻擊。在教育應用中，這意味著需要謹慎選擇和處理用於訓練模型的學生資料，以確保公平性和避免不必要的偏見。

原始文獻資訊

英文標題：: Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions
作者：: J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis
來源：: arXiv - Computers and Society
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。