AI导读:

阿里发布全新大模型Qwen2.5-Max,展现出强劲的综合性能,全面超越全球领先的开源MoE模型及最大的开源稠密模型。同时,阿里还开源了视觉理解模型Qwen2.5-VL,夺得视觉理解冠军。这些创新成果展示了中国在AI领域的实力和追赶速度。

大年初一,阿里通义千问团队发出了大模型新年第一弹。1月29日凌晨1点半,阿里云通义千问旗舰版模型Qwen2.5-Max正式升级发布。这一新模型是阿里云通义团队对MoE(混合专家)模型的最新探索成果,预训练数据超过20万亿tokens,展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。

据介绍,Qwen2.5-Max采用超大规模MoE架构,基于庞大的预训练数据及精心设计的后训练方案进行训练。该模型在知识、编程、全面评估综合能力的以及人类偏好对齐等主流权威基准测试上,均展现出全球领先的性能。在与Claude-3.5-Sonnet、GPT-4o、Deepseek-V3及Llama-3.1-405B等模型的对比中,Qwen2.5-Max表现卓越,几乎全面超越了这些模型。

除了Qwen2.5-Max以外,1月28日,阿里还开源了全新的视觉理解模型Qwen2.5-VL,推出了3B、7B、72B三个尺寸版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,全面超越GPT-4o与Claude3.5。Qwen2.5-VL不仅擅长识别常见物体,还能分析图像中的文本、图表、图标等,甚至具备理解长视频和捕捉事件的能力,以及视觉定位和结构化输出的功能。

受新模型发布的影响,阿里巴巴美股一度涨超7%,收盘时录得6.71%的涨幅,报96.03美元/股。Qwen2.5-Max的发布引发了资本市场关于重估中国AI资产的讨论。业内人士分析认为,阿里云不仅发布了与全球顶尖模型比肩甚至更优的模型,而且具备完整的云生态,或能形成类似去年北美云计算服务商的投资逻辑。

近期,DeepSeek大模型在人工智能领域掀起轩然大波,但其并非唯一值得关注的模型。包括阿里通义千问、字节豆包、腾讯混元在内的互联网大厂大模型能力同样不容小觑。这些大厂模型往往基于多模态设计,在大语言模型基础上融合了图片、音频、视频等多种模态,对算力底座要求更高。然而,由于商业化等方面的考量,这些大厂模型往往不会完全开源。

与此同时,DeepSeek大模型也面临着一些争议。有报道称DeepSeek使用了数据蒸馏技术来优化模型训练效率,并引发了关于知识产权窃取的担忧。然而,多名业内人士表示,“蒸馏”是大模型训练中一种常用的方法,虽然存在一定争议,但能够大幅提高模型训练效率和降低成本。不过,过度“蒸馏”也可能导致模型性能下降。

总的来说,无论是阿里的Qwen2.5-Max和Qwen2.5-VL模型、DeepSeek大模型还是其他国内大厂的大模型都在不断推动着人工智能技术的进步和发展。这些模型的发布和创新成果不仅展示了中国在人工智能领域的实力和追赶速度,也为全球AI行业的发展带来了新的机遇和挑战。