别光给Agent加Tool了,它根本选不明白!复旦×通义提出全新CUA训练范式
量子位3966 字 (约 16 分钟)
85
复旦×通义提出ToolCUA范式,解决Agent在GUI与Tool间盲目选择问题,准确率提升至46.85%,超越Claude-4-Sonnet;通过合成混合轨迹与轨迹级奖励机制,实现高效路径决策。
入选理由:ToolCUA在OSWorld-MCP上达46.85%准确率,超越Claude-4-Sonnet,接近Claude-4.5-Sonnet。
精选文章#Agent#CUA#Tool Selection#Reinforcement Learning#Open Source中文
