Lexara：以使用者為中心的對話式視覺分析LLM評估工具

arXiv - Human-Computer InteractionSrishti Palani, Vidya Setlur2026年3月9日

開發了Lexara工具包，提供可操作的測試案例、可解釋的多格式評估指標，協助非程式設計者評估對話式視覺分析中的大型語言模型。

AI 幫你先抓重點

AI 重點 1

Lexara 工具包提供使用者友善的界面，讓非程式設計者也能評估大型語言模型在對話式視覺分析中的表現。

滑鼠懸停看 AI 判斷理由

這點至關重要，因為過去評估 LLM 在 CVA 領域一直需要專業的程式技巧，限制了更廣泛的參與和更快的迭代。Lexara 降低了評估門檻，加速了 CVA 應用開發，並讓更多人能參與模型優化，這對教育科技研究者和開發者都極具價值。

AI 重點 2

Lexara 結合了規則基礎方法與 LLM-as-a-Judge 策略，提供可解釋的視覺和語言品質評估指標。

滑鼠懸停看 AI 判斷理由

僅僅知道模型是否有效還不夠，理解 *為何* 有效更重要。Lexara 的指標體系，涵蓋資料保真度、分析推理等面向，能幫助使用者深入理解模型在不同方面的優劣，並針對性地進行改進，這對於提升 CVA 系統的可靠性和可信度至關重要。

教育工作者可利用Lexara設計對話式視覺分析任務，透過可解釋指標評估學生互動；課程設計者可將工具納入SRL與PBL環境，促進學生自我監控與協作；研究者可借助LLM-as-Judge方法進行多模態評估，提升研究效度。

英文標題：: Lexara: A User-Centered Toolkit for Evaluating Large Language Models for Conversational Visual Analytics
作者：: Srishti Palani, Vidya Setlur
來源：: arXiv - Human-Computer Interaction
AI 摘要模型：: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

每週五信箱收到精選 5 篇教育科技重點研究摘要，零時間壓力掌握學術前沿。