增強大型語言模型工具呼叫的國際工具呼叫資料集

arXiv - Human-Computer InteractionZuoyu Zhang, Yancheng Zhu2026年3月9日

提出國際工具呼叫資料集，提升多語言 LLM 工具使用效能與跨域魯棒性。

AI 幫你先抓重點

AI 重點 1

ITC資料集提供3,571個真實API與17,540個工具呼叫任務，涵蓋40國與20類別，具備前所未有的多語言與地理多樣性。

滑鼠懸停看 AI 判斷理由

這個資料集的規模與真實性是關鍵，它解決了以往工具呼叫基準過於模擬化的問題。研究者和開發者能藉此更準確地評估和提升LLM在真實世界、多文化環境下的工具使用能力，避免模型在特定語言或地區表現不佳的風險。

AI 重點 2

實驗結果顯示，開源與封閉源LLM在工具呼叫上存在顯著差距，尤其在非英語查詢時表現較差，而使用ITC微調能有效提升跨語言推理與魯棒性。

滑鼠懸停看 AI 判斷理由

這揭示了目前LLM在跨語言工具使用方面的不足，並提供了一個具體的解決方案。對於教育科技領域，意味著需要特別關注模型在不同語言環境下的表現，並透過ITC等資料集進行微調，以確保所有學生都能獲得公平且有效的學習體驗。

教育工作者可利用 ITC 資料集設計多語言工具呼叫練習，幫助學生在實際 API 使用中培養問題解決與跨文化溝通能力。課程設計者可將 ITC 任務嵌入 PBL 框架，促進學生自主學習與協作。AI 研究者則可透過微調 ITC 資料提升模型對非英語環境的魯棒性，進而開發更具全球化的教育應用。

英文標題：: Enhancing Tool Calling in LLMs with the International Tool Calling Dataset
作者：: Zuoyu Zhang, Yancheng Zhu
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。