美团LongCat团队发布VitaBench智能评测基准并开源

国内财经 2025-10-20 22:25:16 来源：上海证券报·中国证券网作者：网络

AI导读：

10月20日，美团LongCat团队发布高度贴近真实生活场景的VitaBench智能体评测基准，以外卖点餐等三大场景为载体，构建66个工具的交互式评测环境，并已全面开源。

　　上证报中国证券网讯（记者杨翔菲）10月20日，美团LongCat团队正式发布当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench（Versatile Interactive Tasks Benchmark），该基准聚焦智能评测，并已全面开源，为智能技术发展提供重要支持。

　　据介绍，VitaBench以外卖点餐、餐厅就餐、旅游出行三大高频真实生活场景为典型载体，构建了包含66个工具的交互式评测环境，并进行了跨场景的综合任务设计，展现了智能评测的全面性。

（文章来源：上海证券报·中国证券网）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。

美团LongCat团队发布LongCat-Flash-Thinking高效推理模型

全球指数

美团LongCat团队发布VitaBench智能评测基准并开源

AI导读：

相关文章

美团LongCat团队发布LongCat-Flash-Thinking高效推理模型

热门文章

看了这篇文章的还看了