快手可灵AI发布2.0模型,AI视频生成技术再升级
AI导读:
快手旗下可灵AI发布2.0视频生成模型及可图2.0图像生成模型,采用Multi-modal Visual Language技术,实现多模态视频编辑。全球用户规模突破2200万,累计营业收入超1亿元,展现出强大商业潜力。
随着AI生成视频技术的兴起,将用户创意精准转化为AI视频成为新挑战。用户常感难以仅凭文字描述需求。
4月15日,快手旗下可灵AI发布2.0视频生成模型及可图2.0图像生成模型。快手高级副总裁盖坤表示,AI在辅助创意表达上潜力巨大,但当前行业在内容稳定性和复杂创意传达上仍面临挑战。
此次2.0版本迭代,亮点在于多模态视频编辑功能:采用Multi-modal Visual Language(MVL),结合图像、视频等多模态信息,高效传达用户多维度创意。用户可直接输入图像,生成创意视频。
盖坤介绍,MVL由TXT和MMW组成,从基础方向和精细控制层面,实现创意表达。MMW不仅限于图片和视频,还能引入声音、运动轨迹等信息,丰富用户表达。
自去年6月发布以来,可灵AI已迭代超20次,全球用户规模突破2200万,月活用户增长25倍。
据盖坤介绍,可灵和可图在团队内部评测中稳居业内第一。例如,在文生视频领域,可灵2.0对比谷歌Veo2、Sora优势明显。
值得注意的是,图生视频占可灵AI视频创作量的85%,图片质量对视频效果至关重要。
快手副总裁张迪介绍,可图2.0文生图能力升级,支持60多种风格化效果,创意和想象力大幅提升。同时上线图像可控编辑功能,支持局部重绘、扩图和风格转绘。
可灵AI面向B端商家提供API接入服务,已与小米、亚马逊云科技、阿里云等数千家企业合作。
财报显示,自可灵AI开始商业化变现至2025年2月,累计营业收入超1亿元,展现出强大商业潜力。
AI视频成为互联网公司竞争焦点。腾讯、字节跳动等大厂也推出相关产品。
(文章来源:澎湃新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

