中国信通院推动具身智能国际标准冻结,引领智能系统新发展
11月17日,中国信通院宣布主导推动的国际标准《具身智能系统框架及能力要求》正式冻结,并成功推动2项新立提案,围绕系统基准测试和数据方向,为具身智能产业落地提供标尺,促进数据标准化和互通共享。...
Meta推出V-JEPA 2模型,提升AI物理推理能力
Meta公司推出V-JEPA 2模型,实现最先进的视觉理解和预测,提升AI代理物理推理能力。同时发布三项新基准测试,评估现有模型从视频推断物理世界的能力。...
OpenAI发布BrowseComp基准测试,推动AI信息检索能力升级
4月10日,OpenAI宣布开源包含1266个挑战性问题的基准测试BrowseComp,旨在衡量AI智能体在互联网上定位难以查找、相互关联信息的能力。与现有基准测试不同,BrowseComp不再局限于衡量模型检索基本孤立事实的能力,有望为AI技术提供更全面的评估标准。...
国家地方共建创新中心推出大规模机器人数据集RoboMIND
国家地方共建具身智能机器人创新中心与北京大学计算机学院联合推出大规模多构型智能机器人数据集和基准测试RoboMIND,涵盖5万5千条机器人轨迹数据,涉及279项任务,覆盖多生活服务场景。...
《巢燧大模型基准测试报告》发布:中文大模型能力大幅提升
《巢燧大模型基准测试报告》正式发布,报告显示中文大模型在学科知识和数学推理等领域能力大幅提升,闭源模型表现优于开源模型,同时需重视伦理和安全性问题。...
2024人工智能大模型基准测试科创发展大会在成都举行
2024人工智能大模型基准测试科创发展大会在成都高新区举办,发布《“巢燧”大模型基准测试报告》,成立高校大模型创新发展联盟,评选出大模型领域“2024年度十大突破技术和进展”。...


