阿里巴巴发布通义百聆语音模型,引领AI语音新潮流
AI导读:
9月24日,阿里巴巴在2025杭州云栖大会上发布通义百聆语音模型,包括Fun-ASR语音识别大模型和Fun-CosyVoice语音合成大模型。Fun-ASR具备强大上下文理解能力,Fun-CosyVoice提供上百种预制音色,开源模型下载量已超5.6亿。
本报讯 (记者梁傲男)9月24日,在2025杭州云栖大会上,阿里巴巴集团控股有限公司发布全新语音模型家族——通义百聆语音模型,这一科技突破标志着阿里巴巴在人工智能语音领域迈出了重要一步。通义百聆涵盖语音识别大模型Fun-ASR、语音合成大模型Fun-CosyVoice。Fun-ASR基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性,可实时处理10多种语言,展现了阿里巴巴在语音识别技术上的深厚积累;Fun-CosyVoice则可提供上百种预制音色,适用于客服、销售、直播电商、消费电子、有声书、儿童娱乐等多样化场景,极大地丰富了语音合成的应用范围。目前,通义百聆开源模型的下载量已超5.6亿,彰显了其在市场上的广泛认可。
(文章来源:证券日报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

