AI导读:

国产AI视频模型在技术与商业化应用上取得显著突破,超越海外Sora等模型,占据全球领先地位。腾讯、阿里等大厂及创业公司阶跃星辰等持续加码开源技术,推动视频模型发展。中金证券指出,成本降低将促进视频大模型技术的持续进步。

蓝鲸新闻3月22日讯 Sora曾被誉为AI视频领域的“神话”,但如今,随着国内AI视频技术的突飞猛进,这一“神话”地位正面临挑战。

国产AI视频模型不仅在技术上取得显著进步,更在商业化应用上展现出强大竞争力,预示着由中国企业主导的视频模型新时代的到来。

一方面,国内创业公司与科技巨头不断加大对AI视频领域开源技术的投入;另一方面,头部视频模型创业公司频获新融资,加速技术迭代与产品商业化,全球范围内掀起视频创作热潮。

视频模型开源浪潮迭起,大厂与创业公司齐发力

当前,由Deepseek引发的开源热潮已蔓延至视频模型领域,腾讯、阿里等大厂及阶跃星辰等创业公司均在视频开源领域持续取得突破。

最新开源动态来自阶跃星辰。3月20日,阶跃星辰宣布开源图生视频模型Step-Video-TI2V,该模型基于30B参数Step-Video-T2V训练,能生成102帧、5秒、540P分辨率的视频,在图生视频领域权威基准测试VBench-I2V中达到顶尖水平,全球排名靠前。

据阶跃星辰介绍,该模型已与华为昇腾计算平台完成适配,可在阶跃AI网页版、App端及魔乐社区(Modelers)体验。

此前,阿里和腾讯因开源而备受市场关注。3月6日,腾讯混元发布图生视频模型并开源,同时上线对口型与动作驱动等玩法,支持生成背景音效及2K高质量视频。用户仅需上传图片并用文字指令,混元即可让图片动起来,生成5秒短视频,并自动配乐。

2月25日,阿里云旗下视觉生成基座模型万相2.1(Wan)开源,采用宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重均开源,支持文生视频和图生视频任务。

有开发者表示,万相2.1模型开源后,其1.3B版本可在消费级显卡上部署,助力个人创作者快速生成视频,甚至几分钟内即可在本地完成,对用户极为有利。

从实践来看,开源模型的推进降低了企业和开发者使用视频模型的门槛,吸引更多人参与视频模型的研究与应用。

此外,基于开源模型,将涌现更多新商业模式,如模型服务提供商、应用开发商等,推动AI视频技术在产业端与用户端的落地生根。

中金证券研报指出,从成本角度看,万相2.1专业版和快速版API调用成本分别为0.7、0.24元/秒,与主流视频大模型接入成本相近,将促进视频大模型技术的持续进步,加速中小厂商的二次研发。

一位视频模型创业公司从业者表示,随着开源生态的繁荣,将促进闭源模型的发展。视频模型到视频应用是复杂的系统工程,需模型与应用深度结合。目前,用户量大、产品成熟的模型仍以闭源为主,但开源社区的活跃将吸引更多优秀开发者加入,开发出更多应用,推动行业共同进步。

国产AI视频逆袭超越Sora,技术与商业化持续领先

国内公司在产品化和商业化层面持续突破,已超越OpenAI的Sora,占据全球领先地位。

MiniMax在视频模型领域持续发力:2024年9月发布首款AI高清视频生成模型Abab-video-1;同年12月发布图生视频模型I2V-01-Live,优化二次元效果;2025年1月中旬发布S2V模型,支持主体参考功能;3月全球上线镜头控制功能。

全球著名投资基金、咨询公司a16z发布的2025年全球100大生成式AI应用排行榜中,海螺视频、快手可灵等国内视频AI排名领先,超越海外的Sora。

除技术进展外,投资人持续加码布局头部视频模型创业公司,AI视频产品的商业化探索也在拓展。

近日,国内AI视频头部创业公司爱诗科技宣布完成A5轮融资。爱诗最新发布的PixVerse V4版本,首创5秒极速生成、有声视频生成、智能人声。截至目前,爱诗科技旗下AI视频生成产品PixVerse全球用户量已突破4000万,月活跃用户(MAU)达1500万。创新功能在海外广受好评。

爱诗科技联合创始人谢旭璋表示,爱诗在商业化层面正持续探索C端和B端场景。在C端用户上有深厚积累,同时思考如何结合客户场景与爱诗的C端用户影响力,在产品与服务上做出尝试。在广告、电商等营销场景上也进行了不同探索。

更多创业者受益于AI视频工具带来的创作新体验,对国内AI视频产品有更直观感受。

视频模型创作者Jason认为,尽管海外模型在创新能力上领先,如ChatGPT、Sora和Agent概念首先在海外得到验证,但国内模型在创新速度上更胜一筹,能快速跟上并迭代新技术,催生大量模型和应用。

“像Sora这类被认为能颠覆行业的模型,其视频生成效果可能不如国内的海螺、可灵等,这体现了技术路线的快速变化和国内的追赶速度。”Jason提到。

在使用海内外AI视频工具中,Jason体会到,“专注于打好基础模型的策略是国内模型的重要竞争力。以海螺为例,尽管功能不如其他模型多,但其强大的底层技术使生成视频动作更为自然真实。这种基础模型能力是提升用户体验的关键。”

由此可见,国内AI视频模型的核心竞争力在于快速创新迭代、扎实基础能力及积极商业化探索。未来,通过高清质量、多模态整合、高级模型研发、美学表现和用户体验等方面的持续突破,国内AI视频模型有望继续保持甚至扩大领先地位。

(文章来源:蓝鲸财经