ai assessment governance edtech accountability

如何在不洩露模型的前提下，實現 AI 輔助補助金評估的可審計性

arXiv - Computers and SocietyKemal Bicakci2026年4月29日

提出一種基於可信執行環境（TEE）的架構，在保護評估模型與準則私密性的同時，確保評估過程可被外部驗證。

AI 幫你先抓重點

AI 重點 1

區分「程序可驗證性」與「結果正確性」的界線

滑鼠懸停看 AI 判斷理由

這項研究明確指出，技術手段能確保評估過程符合既定程序（可審計），但無法直接證明評估結果在科學或公平性上的絕對正確。這提醒決策者，AI 治理應著重於流程透明度，而非盲目信任 AI 的判斷。

AI 重點 2

防範隱蔽式提示詞注入（Prompt Injection）的必要性

滑鼠懸停看 AI 判斷理由

在自動化評估場景中，申請者可能在文件中埋入隱藏指令來操縱 AI。這項洞察強調了在教育或行政評估中使用 LLM 時，必須建立資料淨化層，而不僅僅是關注模型本身的性能。

核心研究發現

1
提出一種基於 TEE 的架構，透過遠端驗證技術，讓外部驗證者能在不接觸模型權重或評分邏輯的情況下，確認評估所使用的模型、準則與提示詞模板。
2
開發了一套「經驗證的評估包」（attested evaluation bundle），將原始提交雜湊值、輸入雜湊值、模型與準則測量值及輸出結果進行數位簽章與時間戳記連結。
3
針對申請者可能透過文件進行「提示詞注入」的風險，設計了規範化與淨化層，用於標準化文件表示法並記錄可疑的轉換行為，以防範惡意指令影響 AI 評估。

對教育工作者的啟發

對於涉及大規模自動化評估（如獎學金審查、研究計畫評選）的教育機構，此研究提供了重要的治理框架。實務上，當引入 AI 輔助決策時，不應僅追求效率，更需建立「可審計的黑盒」機制。建議機構在部署 AI 評估工具時，應考慮引入類似 TEE 的技術環境，確保評估準則不被惡意利用（Gaming the system），同時保留可追溯的數位紀錄，以應對申請者的申訴，建立技術與行政程序間的信任鏈。

原始文獻資訊

英文標題：: Making AI-Assisted Grant Evaluation Auditable without Exposing the Model
作者：: Kemal Bicakci
來源：: arXiv - Computers and Society
AI 摘要模型：: /models/gemma-4-26B-A4B-it

閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。