阿里巴巴发布新一代视频模型万相2.6系列
AI导读:
阿里巴巴发布新一代视频模型万相2.6系列,支持角色扮演和分镜控制功能,为专业影视制作与图像创作场景提供高效AI工具支持。
12月16日,阿里巴巴正式发布新一代视频模型万相2.6系列,该模型面向专业影视制作与图像创作场景完成全面升级,不仅是国内首个支持角色扮演功能的视频模型,更凭借音画同步、多镜头生成、声音驱动等综合能力,成为全球功能最全的视频生成模型。目前,该模型已同步上线阿里云百炼及万相官网,千问APP也将于近期接入并推出更多玩法。
作为万相2.5模型的迭代升级版本,万相2.6在画质、音效及指令遵循能力上实现进一步提升,单次生成视频时长达到国内最高的15秒。此次升级最受关注的亮点,是新增的角色扮演和分镜控制两大核心功能:角色扮演功能可参考输入视频中角色的外观、音色,结合用户提示词快速生成单人、多人或人与物合拍的影视级视频,普通用户上传个人视频并输入风格提示词,几分钟内即可完成分镜设计、角色演绎、画面配音等全流程,实现“当电影主角”的体验;分镜控制功能则能通过高层语义理解,将简单提示词转化为具备完整故事线的专业多分镜脚本,在镜头丝滑切换中保持主体、场景、氛围的高度一致,满足广告设计、短剧制作等专业场景需求。
据介绍,万相2.6通过多模态联合建模技术,可精准提取参考视频的情绪、姿态、视觉特征及音色、语速等声学特征,实现画面与声音的全维度一致性迁移,目前已支持单人和多人表演。该模型的推出,让普通用户轻松“当导演”成为可能——输入广告创意、剧情设定等连续提示词,即可生成叙事完整的短片。
截至目前,万相模型家族已覆盖文生图、图像编辑、文生视频、角色扮演等10余种视觉创作能力,广泛应用于AI漫剧、广告设计、短视频创作等领域。企业用户可通过阿里云百炼调用模型API,个人用户则能直接在万相官网体验,为专业创作与大众娱乐提供了更高效的AI工具支持。
(文章来源:广州日报新花城)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

