快手可灵AI发布2.0模型，AI视频生成技术再升级

财经聚焦 2025-04-16 08:50:44 来源：澎湃新闻作者：网络

AI导读：

快手旗下可灵AI发布2.0视频生成模型及可图2.0图像生成模型，采用Multi-modal Visual Language技术，实现多模态视频编辑。全球用户规模突破2200万，累计营业收入超1亿元，展现出强大商业潜力。

随着AI生成视频技术的兴起，将用户创意精准转化为AI视频成为新挑战。用户常感难以仅凭文字描述需求。

4月15日，快手旗下可灵AI发布2.0视频生成模型及可图2.0图像生成模型。快手高级副总裁盖坤表示，AI在辅助创意表达上潜力巨大，但当前行业在内容稳定性和复杂创意传达上仍面临挑战。

此次2.0版本迭代，亮点在于多模态视频编辑功能：采用Multi-modal Visual Language（MVL），结合图像、视频等多模态信息，高效传达用户多维度创意。用户可直接输入图像，生成创意视频。

盖坤介绍，MVL由TXT和MMW组成，从基础方向和精细控制层面，实现创意表达。MMW不仅限于图片和视频，还能引入声音、运动轨迹等信息，丰富用户表达。

自去年6月发布以来，可灵AI已迭代超20次，全球用户规模突破2200万，月活用户增长25倍。

据盖坤介绍，可灵和可图在团队内部评测中稳居业内第一。例如，在文生视频领域，可灵2.0对比谷歌Veo2、Sora优势明显。

值得注意的是，图生视频占可灵AI视频创作量的85%，图片质量对视频效果至关重要。

快手副总裁张迪介绍，可图2.0文生图能力升级，支持60多种风格化效果，创意和想象力大幅提升。同时上线图像可控编辑功能，支持局部重绘、扩图和风格转绘。

可灵AI面向B端商家提供API接入服务，已与小米、亚马逊云科技、阿里云等数千家企业合作。

财报显示，自可灵AI开始商业化变现至2025年2月，累计营业收入超1亿元，展现出强大商业潜力。

AI视频成为互联网公司竞争焦点。腾讯、字节跳动等大厂也推出相关产品。

（文章来源：澎湃新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。