AI导读:

9月24日,阿里巴巴在2025杭州云栖大会上发布通义百聆语音模型,包括Fun-ASR语音识别大模型和Fun-CosyVoice语音合成大模型。Fun-ASR具备强大上下文理解能力,Fun-CosyVoice提供上百种预制音色,开源模型下载量已超5.6亿。

本报讯 (记者梁傲男)9月24日,在2025杭州云栖大会上,阿里巴巴集团控股有限公司发布全新语音模型家族——通义百聆语音模型,这一科技突破标志着阿里巴巴在人工智能语音领域迈出了重要一步。通义百聆涵盖语音识别大模型Fun-ASR、语音合成大模型Fun-CosyVoice。Fun-ASR基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性,可实时处理10多种语言,展现了阿里巴巴在语音识别技术上的深厚积累;Fun-CosyVoice则可提供上百种预制音色,适用于客服、销售、直播电商、消费电子、有声书、儿童娱乐等多样化场景,极大地丰富了语音合成的应用范围。目前,通义百聆开源模型的下载量已超5.6亿,彰显了其在市场上的广泛认可。

(文章来源:证券日报)