利用大型語言模型預測創新

arXiv - Computers and SocietyEnrico Maria Fenoaltea, Filippo Santoro, Giordano De Marzo, Segun Taofeek Aroyehun, Andrea Tacchella

透過專利語言的語義共識,利用大型語言模型預測新技術組合

AI 幫你先抓重點

AI 重點 1

語義共識可作為早期創新預測指標

滑鼠懸停看 AI 判斷理由
此發現顯示,專利語言的集體語義變化可在數十年前預示新技術組合,為研發與政策制定提供可量化的早期警示。
AI 重點 2

TechToken 的代碼嵌入方法提升專利語言模型效能

滑鼠懸停看 AI 判斷理由
將 IPC 代碼視為詞彙並進行微調,TechToken 能捕捉技術語義結構,顯著優於現有模型,說明領域專屬嵌入對專利分析與創新預測的關鍵價值。

核心研究發現

  1. 1

    先前的技術組合在專利語言中可追蹤到數十年前的語義共識

  2. 2

    TechToken 將 IPC 代碼視為詞彙,透過微調學習技術語言,並以代碼嵌入的上下文相似度衡量語義收斂

  3. 3

    上下文相似度能準確預測首次技術組合,並在多項專利相關任務中優於現有模型

對教育工作者的啟發

實務工作者可將 TechToken 整合至專利檢索系統,透過上下文相似度追蹤技術語義收斂,提前發現潛在創新組合;同時可將此指標納入投資評估與研發資源配置,提升決策精準度。

原始文獻資訊

英文標題:
Anticipating Innovation Using Large Language Models
作者:
Enrico Maria Fenoaltea, Filippo Santoro, Giordano De Marzo, Segun Taofeek Aroyehun, Andrea Tacchella
來源:
arXiv - Computers and Society
AI 摘要模型:
openai/gpt-oss-20b
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。