腾讯混元图像3.0发布,全球文生图榜单登顶
AI导读:
腾讯混元图像3.0发布一周即登顶全球文生图榜单,展现强大技术实力。该模型为首个开源工业级原生多模态生图模型,具备常识推理和高质感图片生成能力,受到开发者热烈欢迎。
腾讯混元图像 3.0 发布仅仅一周,就开启了全球“霸榜”模式,成为科技领域热门话题。这一多模态生成模型展现了强大的竞争力。
10月5日,国际大模型竞技场LMArena最新文生图榜单显示,混元图像 3.0在全球26个大模型中,高居第一位。这一结果来自全球所有用户的“盲测”,这也标志着混元在多模态生成方面达到全球领先水平,引领了科技新潮流。
LMArena官方社交平台也第一时间发文祝贺:“文生图排行榜大洗牌!腾讯混元图像3.0登顶竞技场——同时被评为最佳综合文生图模型与最佳开源文生图模型。这款图像生成模型已超越Seedream 4,以及代号"nano-banana"的Gemini 2.5 Flash Image Preview。重大突破,恭喜腾讯混元。”这一消息迅速传遍科技圈。
9 月初,腾讯混元开源的图像2.1已是当时效果最佳的开源生图模型。此次混元图像3.0更上一层楼,首次夺得文生图榜单冠军,超越众多顶级闭源模型,展现出强大的技术实力,为科技发展树立了新标杆。
LMArena是美国加州大学伯克利分校推出的创新AI模型评估平台,评测核心方法是基于人类真实偏好的“盲测”机制,让用户对不同AI模型的回答进行匿名投票,衡量模型的表现。用户输入问题后,平台提供两个模型的回答,用户根据偏好选择更优答案,投票结果直接塑造公共排行榜。 由于该平台访问量巨大,并且评测机制贴近实际体验,是目前国际上最权威的竞技场榜单。
混元图像3.0是腾讯9月28日发布并开源的原生多模态生图模型。这是首个开源工业级原生多模态生图模型,也是目前效果最好的开源生图模型。混元图像3.0具备常识并能够利用知识进行推理;同时语义理解准确度高,并具备极致美学质感,能生成真实的高质感图片;支持中英文文字生成,长文本文字渲染,为图像生成领域带来新突破。
混元图像3.0模型也同样受到开发者的欢迎,发布后不久即登上了Hugging Face开源社区模型热榜的第一名,持续一周稳居第一;如今又登上了LMarena榜单的榜首,反映了用户与社区对模型的关注与认可,彰显了其市场影响力。
腾讯混元团队透露,混元图像3.0目前的版本已开放了文生图能力,图生图、图像编辑、多轮交互等版本将于后续发布。多模态正在成为混元大模型的核心竞争力之一,混元3D与图像生成模型均处于行业顶尖水平。
在3D生成领域,8月上海人工智能实验室的全球3D生成模型评测榜单显示,混元3D模型在图生3D和文生3D任务中均位列第一;混元世界模型Voyager在斯坦福大学WorldScore基准测试中综合能力排名首位。混元目前已形成语言、图像、视频、3D模型的多尺寸、多模态开源矩阵,提供接近商业模型性能的开源基座。图像、视频衍生模型数量总数达到3000个,混元3D系列模型社区下载量超过260万,是全球最受欢迎的3D开源模型。
(文章来源:深圳商报·读创)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

