增強大型語言模型工具呼叫的國際工具呼叫資料集

arXiv - Human-Computer InteractionZuoyu Zhang, Yancheng Zhu

提出國際工具呼叫資料集,提升多語言 LLM 工具使用效能與跨域魯棒性。

AI 幫你先抓重點

AI 重點 1

ITC資料集提供3,571個真實API與17,540個工具呼叫任務,涵蓋40國與20類別,具備前所未有的多語言與地理多樣性。

滑鼠懸停看 AI 判斷理由
這個資料集的規模與真實性是關鍵,它解決了以往工具呼叫基準過於模擬化的問題。研究者和開發者能藉此更準確地評估和提升LLM在真實世界、多文化環境下的工具使用能力,避免模型在特定語言或地區表現不佳的風險。
AI 重點 2

實驗結果顯示,開源與封閉源LLM在工具呼叫上存在顯著差距,尤其在非英語查詢時表現較差,而使用ITC微調能有效提升跨語言推理與魯棒性。

滑鼠懸停看 AI 判斷理由
這揭示了目前LLM在跨語言工具使用方面的不足,並提供了一個具體的解決方案。對於教育科技領域,意味著需要特別關注模型在不同語言環境下的表現,並透過ITC等資料集進行微調,以確保所有學生都能獲得公平且有效的學習體驗。

核心研究發現

  1. 1

    ITC 資料集包含 3,571 個真實 API 與 17,540 個工具呼叫任務,覆蓋 20 個類別與 40 個國家,提供前所未有的多語言與地理多樣性。

  2. 2

    實驗顯示開源與封閉源 LLM 在工具呼叫表現上存在顯著差距,尤其在非英語查詢上表現更差。

  3. 3

    在 ITC 上進行微調可顯著提升 LLM 的跨語言推理一致性與對外域工具的魯棒性,尤其對非英語輸入效果顯著。

  4. 4

    ITC 資料集的真實 API 使模型在面對實際業務場景時的適應性更高,減少了對模擬環境的依賴。

  5. 5

    本研究提供了一個可重複、可擴充的基準,為未來跨國、跨語言 LLM 工具呼叫研究與實務應用奠定基礎。

對教育工作者的啟發

教育工作者可利用 ITC 資料集設計多語言工具呼叫練習,幫助學生在實際 API 使用中培養問題解決與跨文化溝通能力。課程設計者可將 ITC 任務嵌入 PBL 框架,促進學生自主學習與協作。AI 研究者則可透過微調 ITC 資料提升模型對非英語環境的魯棒性,進而開發更具全球化的教育應用。

原始文獻資訊

英文標題:
Enhancing Tool Calling in LLMs with the International Tool Calling Dataset
作者:
Zuoyu Zhang, Yancheng Zhu
來源:
arXiv - Human-Computer Interaction
AI 摘要模型:
ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g
閱讀原文

每週精選研究電子報

每週五信箱收到精選 5 篇教育科技重點研究摘要,零時間壓力掌握學術前沿。