AI导读:

广州深入开展“人工智能+”行动,趣丸科技推出全球领先的AI语音创作平台趣丸千音,提供一站式智能语音解决方案,赋能影视动漫、有声读物、新闻传媒等多个行业,展现广阔应用前景。

  当前,在广州“12218”现代化产业体系的战略布局下,人工智能已成为15个战略性产业集群的关键一环。广州正积极推行“人工智能+”行动,本地企业正不断拓展人工智能在多个领域的创新应用,为各行各业注入新活力。

  记者从趣丸科技获悉,其旗下首款搭载SOTA模型的AI语音应用——趣丸千音(英文名:All Voice Lab)近日已启动邀测。这是继趣丸科技去年发布全球领先AI音乐产品“天谱乐”后的又一力作。

  AI助力一站式智能语音创作平台

  据悉,天谱乐是全球首个多模态音乐生成大模型,曾在第三届琶洲算法大赛中荣获全球总冠军。作为全球领先的AI语音创作平台,趣丸千音提供一站式智能语音解决方案,集成了文本转语音、视频翻译、多语种合成等功能,是业界首个在模型到应用层面均超越国际先进水平的AI语音产品。它适用于影视动漫、有声读物、新闻传媒、文旅导览等多个领域,为内容创作与国际传播带来全流程革新,为用户提供沉浸式体验。

  在MaskGCT(Masked Generative Codec Transformer)模型的支持下,趣丸千音在语音相似度、准确率、质量和稳定性方面均优于同类产品,支持中文、英语、日语、法语、德语、韩语等多语种生成,满足全球化语音输出需求。

  据了解,MaskGCT是趣丸科技与香港中文大学(深圳)联合研发的开源语音大模型,采用掩码生成模型与语音表征解耦编码的创新范式,曾登顶GitHub趋势榜榜首,被誉为“最强AI语音模型”。该模型在“Emilia”这一全球最大且多样的高质量多语种语音数据集上进行训练,展现出卓越的风格迁移及跨语言生成能力。实验证明,该模型在多个TTS基准数据集上均达到SOTA效果,超越当前最先进的同类模型,部分指标甚至超越人类水平。

  “人工智能+”转化前景无限

  小切口蕴含大机遇。与特斯拉打开电动车市场的策略相似,“人工智能+”应用的转化思路是通过极致效率攻克高需求场景,再以标准化能力横向拓展百亿市场。据《2024全球数字内容产业报告》,媒体与泛娱乐领域的多语言翻译需求规模已超过650亿美元,而趣丸千音正成为这一赛道的核心基础设施。因此,趣丸千音在影视动漫、有声读物、新闻传媒、文旅导览、在线教育等领域拥有广阔的应用前景。

  以微短剧为例,当前微短剧在海外风靡一时。据国家广播电视总局国际合作司公布的数据,中国微短剧海外应用已突破300款,全球累计下载量超过4.7亿次;中国微短剧产品已覆盖全球200余个国家和地区。

  短剧出海的爆发,使得译制剧迅速成为出海内容的主体。然而,传统人工译制流程周期长、成本高昂,成为制约短剧作品“走出去”的瓶颈。目前,趣丸千音的视频翻译功能可实现12小时内译制1000分钟剧集,效率较人工提升10倍以上,成本下降15倍以上,为译制行业在AI赋能下迈入工业化量产新纪元按下加速键,为中国优秀作品出海按下“倍速键”。

(文章来源:广州日报)