CRED-1:開放多訊號網域可信度資料集,支援線上錯訊預防
arXiv - Computers and SocietyAlexander Loth, Martin Kappes, Marc-Oliver Pahl
提供 2,672 網域可信度資料集,結合四項信號,支援瀏覽器端預防錯訊
AI 幫你先抓重點
AI 重點 1
四項信號的結合可大幅提升網域可信度評估的準確度,為瀏覽器端預防錯訊提供可擴充的基礎。
滑鼠懸停看 AI 判斷理由
此洞察說明多維度資料可彌補單一指標的偏差,讓開發者能在不依賴雲端的情況下,透過客戶端即時判斷並阻擋潛在錯訊,符合隱私保護與即時性需求。
AI 重點 2
CRED-1 的完全可重現性與開源性,促進跨領域研究與實務落地,降低資料取得門檻。
滑鼠懸停看 AI 判斷理由
此洞察強調資料與流程公開可讓教育科技開發者、研究者快速驗證與擴充模型,並在教學平台中嵌入可信度過濾功能,提升學習者資訊素養。
核心研究發現
- 1
資料集包含 2,672 個網域,按假、不可信、混合、陰謀、諷刺分類,並給予 0.0–1.0 的可信度分數。
- 2
四項信號:域名年齡、網路人氣、事實核查頻率、威脅情報,整合生成可信度分數。
- 3
整個資料收集與計算流程以純 Python 標準函式庫實作,完全可重現,並以 CC BY 4.0 釋出於 Zenodo。
對教育工作者的啟發
教育工作者可利用 CRED-1 於學校網路環境中部署瀏覽器擴充功能,實時過濾可疑網域;教師可將可信度分數納入資訊素養課程,教導學生評估網路資訊;開發者可將資料集作為訓練資料,構建機器學習模型,並在教學平台中加入即時可信度提示。
原始文獻資訊
- 英文標題:
- CRED-1: An Open Multi-Signal Domain Credibility Dataset for Automated Pre-Bunking of Online Misinformation
- 作者:
- Alexander Loth, Martin Kappes, Marc-Oliver Pahl
- 來源:
- arXiv - Computers and Society
- AI 摘要模型:
- openai/gpt-oss-20b
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。