AI导读:

火山引擎在AI创新巡展上发布豆包1.5·深度思考模型,表现突出,尤其在数学推理测试中追平OpenAI模型。该模型支持多模态,能处理复杂任务。火山引擎推出OS Agent解决方案加速AI Agent落地,豆包大模型日均tokens使用量超12.7万亿,市场份额领先。

解读上市公司财报、填报高考志愿、为大家庭推荐露营装备,这些复杂的工作、生活问题在4月17日的火山引擎AI创新巡展杭州站现场被搭载了最新深度思考模型的豆包一一解决。豆包1.5·深度思考模型在数学、编程等领域表现出色,尤其在数学推理AIME 2024测试中得分追平了OpenAI的o3-mini-high模型。

火山引擎总裁谭待在发布会上强调,豆包最新模型的多模态能力显著,如同人类具备视觉和听觉一样,支持多模态的智能体能更好地处理复杂任务。AI Agent正成为业界焦点,火山引擎此次推出了OS Agent解决方案及AI云原生推理套件,以加速Agent的落地。

豆包1.5·深度思考模型采用MoE架构,参数规模低于业界同类模型,具备显著的推理成本优势。在具体应用上,该模型展现了边想边搜能力和视觉版的多模态能力,能够基于文字和画面进行全面思考。

北京市社会科学院副研究员王鹏表示,具备多模态能力是未来推理模型的趋势,能广泛应用于金融、智能客服等领域。截至目前,豆包大模型家族已有15位成员,豆包App成为国内AI原生App的佼佼者,月活用户规模达1.16亿。

火山引擎公布的数据显示,豆包大模型日均tokens使用量超12.7万亿,市场份额位居第一。谭待认为,火山引擎的大模型token调用量未来仍有百倍增长的可能,关键在于模型是否有重大突破。为了加速Agent的落地,火山引擎推出了OS Agent解决方案。

此外,豆包大模型团队发布并开源了基于UI-TARS进行增强的UI-TARS-1.5,在GUI评测基准中取得优异表现。火山引擎还支持MCP协议,致力于成为AI时代最优秀的云厂商。

(文章来源:每日经济新闻)