利用大型語言模型預測創新
arXiv - Computers and SocietyEnrico Maria Fenoaltea, Filippo Santoro, Giordano De Marzo, Segun Taofeek Aroyehun, Andrea Tacchella
透過專利語言的語義共識,利用大型語言模型預測新技術組合
AI 幫你先抓重點
AI 重點 1
語義共識可作為早期創新預測指標
滑鼠懸停看 AI 判斷理由
此發現顯示,專利語言的集體語義變化可在數十年前預示新技術組合,為研發與政策制定提供可量化的早期警示。
AI 重點 2
TechToken 的代碼嵌入方法提升專利語言模型效能
滑鼠懸停看 AI 判斷理由
將 IPC 代碼視為詞彙並進行微調,TechToken 能捕捉技術語義結構,顯著優於現有模型,說明領域專屬嵌入對專利分析與創新預測的關鍵價值。
核心研究發現
- 1
先前的技術組合在專利語言中可追蹤到數十年前的語義共識
- 2
TechToken 將 IPC 代碼視為詞彙,透過微調學習技術語言,並以代碼嵌入的上下文相似度衡量語義收斂
- 3
上下文相似度能準確預測首次技術組合,並在多項專利相關任務中優於現有模型
對教育工作者的啟發
實務工作者可將 TechToken 整合至專利檢索系統,透過上下文相似度追蹤技術語義收斂,提前發現潛在創新組合;同時可將此指標納入投資評估與研發資源配置,提升決策精準度。
原始文獻資訊
- 英文標題:
- Anticipating Innovation Using Large Language Models
- 作者:
- Enrico Maria Fenoaltea, Filippo Santoro, Giordano De Marzo, Segun Taofeek Aroyehun, Andrea Tacchella
- 來源:
- arXiv - Computers and Society
- AI 摘要模型:
- openai/gpt-oss-20b
每週精選研究電子報
每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。