AI导读:

阿里云旗下视觉生成基座模型万相2.1正式采用Apache2.0协议开源,支持文生视频和图生视频任务。未来三年,阿里将投入超过3800亿元用于建设云和AI硬件基础设施,创下中国民营企业在该领域有史以来最大规模投资纪录。

  阿里云,重大消息传来:万相2.1模型正式开源。

  2月25日晚间,阿里云旗下视觉生成基座模型万相2.1(Wan)正式采用最宽松的Apache2.0协议开源,14B和1.3B两个参数规格的全部推理代码和权重均开放。同时,该模型支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace和魔搭社区下载体验。

阿里云实现全模态、全尺寸大模型开源

  据介绍,14B万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集VBench中以总分86.22%的成绩稳居榜首。1.3B版本测试结果不仅超过了更大尺寸的开源模型,还能在消费级显卡运行,仅需8.2GB显存即可生成高质量视频,适用于二次模型开发和学术研究。

  在算法设计上,万相基于主流DiT架构和线性噪声轨迹Flow Matching范式,研发了高效的因果3D VAE、可扩展的预训练策略等。同时,万相在3D VAE的因果卷积模块中实现了特征缓存机制,实现了无限长1080P视频的高效编解码,进一步减少了推理时内存占用。

  实验结果显示,在运动质量、视觉质量、风格和多目标等测试中,万相均达到了业界领先表现。尤其在复杂运动和物理规律遵循上,万相能够稳定展现各种复杂的人物肢体运动,精准还原复杂真实物理场景。

  自2023年起,阿里云坚定大模型开源路线,相继开源了Qwen等多代模型,已成为全球开源社区最重要的模型系列之一。随着万相的开源,阿里云实现了全模态、全尺寸大模型的开源。

  值得一提的是,自2025年1月Deepseek火爆出圈至今,开源已成为国内外众多大模型的“必选项”。今年2月,字节豆包、昆仑万维、百度文心等均推出开源模型。

阿里未来三年投入3800亿元建设云和AI硬件基础设施

  阿里巴巴集团CEO吴泳铭宣布,未来三年阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,创下中国民营企业在该领域有史以来最大规模投资纪录。

  这笔投入发生在AI产业爆发和民营企业座谈会召开之后。吴泳铭表示,阿里巴巴将不遗余力加速云和AI硬件基础设施建设,助推全行业生态发展。

  近期,阿里发布了基于千问Qwen2.5-MAX的深度推理模型,并在海外社交平台发布了QwQ-Max-Preview推理模型预览版,即将发布正式版本及可部署在本地的较小版本。

  目前,阿里云是亚洲第一的云计算公司,通义千问大模型已成为全球顶尖的开源模型。3800亿元巨额资金继续投入,能极大提振相关产业信心。


(文章来源:e公司)