美团LongCat团队发布VitaBench智能评测基准并开源
AI导读:
10月20日,美团LongCat团队发布高度贴近真实生活场景的VitaBench智能体评测基准,以外卖点餐等三大场景为载体,构建66个工具的交互式评测环境,并已全面开源。
上证报中国证券网讯(记者杨翔菲)10月20日,美团LongCat团队正式发布当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench(Versatile Interactive Tasks Benchmark),该基准聚焦智能评测,并已全面开源,为智能技术发展提供重要支持。
据介绍,VitaBench以外卖点餐、餐厅就餐、旅游出行三大高频真实生活场景为典型载体,构建了包含66个工具的交互式评测环境,并进行了跨场景的综合任务设计,展现了智能评测的全面性。
(文章来源:上海证券报·中国证券网)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

