阿里巴巴发布通义百聆语音模型,引领AI语音新潮流
9月24日,阿里巴巴在2025杭州云栖大会上发布通义百聆语音模型,包括Fun-ASR语音识别大模型和Fun-CosyVoice语音合成大模型。Fun-ASR具备强大上下文理解能力,Fun-CosyVoice提供上百种预制音色,开源模型下载量已超5.6亿。...
小米开源MiMo-Audio语音模型,性能超越GPT-4o-Audio
9月19日,小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio,该模型基于创新架构和上亿小时训练数据,在语音理解及对话评测中超越同参数开源模型,性能优于Google和OpenAI的闭源语音模型。...


