美团LongCat发布VitaBench评测基准- DoNews快讯

DoNews > 快讯 > 美团LongCat发布VitaBench评测基准

美团LongCat发布VitaBench评测基准

2025-10-21 11:15:03

466000

2025年10月21日，美团LongCat团队发布全新大模型智能体评测基准VitaBench。该基准聚焦外卖点餐、餐厅就餐和旅游出行三大高频生活场景，构建包含66个工具的交互环境，支持跨场景综合任务测试。评测任务模拟真实用户需求，如旅游规划中需完成订票、订餐等全流程操作，全面评估智能体在复杂问题中的推理、工具调用与交互能力。VitaBench旨在推动大模型智能体向更贴近实际应用的方向发展。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

白鹿卢昱晓同时「翻车」，下沉市场的爱恨为何这么快？抖音养活的演员，正在被抖音反噬。

票房注水、大咖失利，2026五一档一地鸡毛没有对比就没有伤害。

“史上最挤五一档”，到底谁最能打？真正的考验才刚开始。

哈啰共享单车员工把青桔美团踩脚下并发朋友圈哈啰员工聚会照引热议，骑哈啰踩竞品单车被讽‘精神胜利法’；三巨头竞争激烈，曾多次爆发线下冲突。

对话杨澜｜AI时代，她向创意者发起灵魂一问技术越进步，艺术越珍贵

广汽埃安否认被约谈及被立案调查，将依法追究造谣者的法律责任广汽埃安法务部辟谣：未被约谈或立案调查，所谓OTA“锁电”涉事名单系网络捏造，已启动证据保全并追责造谣者。

王暖暖控诉MCN无忧传媒：长期霸凌、PUA 泰国孕妇坠崖案当事人王暖暖控诉MCN机构无忧传媒霸凌、PUA及超负荷压榨，孕期仍强制直播，致其突发惊厥送医。

再出爆款！最具性价比C级闪充车型上市，售价15.08万起再出爆款！最具性价比C级闪充车型上市，售价15.08万起

关于我们| 电子协议| 合作联系| 京ICP备2025120072号

网站信息

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号

京公网安备11010802023059号