美团大模型赛道加速跑,LongCat系列引领AI新潮流
AI导读:
美团在大模型赛道悄然推进,连发三款LongCat系列模型,包括视频生成模型等,达到开源SOTA水平。美团明确AI策略,将AI、机器人等作为未来核心方向,展现其在AI领域的坚定决心和广泛布局。
应对外卖市场激烈竞争的同时,美团在大模型赛道悄然推进,积极布局AI科技。10月27日,美团LongCat团队发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最先进水平),可稳定输出5分钟级别的长视频,为AI视频生成领域树立新标杆。2023年,美团元老王慧文自带5000万美元成立光年之外,后续由于个人健康原因,公司由美团创始人王兴“兜底”。接手光年之外的同时,美团继续深耕大模型,在2024财年业绩发布会上,美团还正式明确了AI策略,展现了其在AI领域的坚定决心。
连发三款
当普罗大众提到美团时会想到什么?大概率是外卖。但这家以外卖闻名的公司,在AI大模型领域同样表现抢眼,9月至今已公开三项大模型进展。9月1日,美团发布并开源大语言模型LongCat-Flash-Chat(中文名:龙猫),LongCat-Flash采用创新性混合专家模型(Mixture-of-Experts,MoE)架构,总参数560B,激活参数18.6B—31.3B(平均27B),实现了计算效率与性能的双重优化,彰显美团AI技术实力。
9月22日,美团LongCat团队正式发布全新高效推理模型LongCat-Flash-Thinking。综合评估显示,LongCat-Flash-Thinking在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的最先进水平(SOTA),进一步巩固美团在AI领域的地位。
一个月后的10月27日,美团LongCat团队再次发布并开源LongCat-Video视频生成模型,该模型以统一架构在文生、图生视频任务上达到开源SOTA,并依托原生视频续写任务预训练,实现分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性,在长视频生成领域具备显著优势,成为美团AI战略的重要一环。
一个外界更容易感知的数据被提及,LongCat-Video视频生成模型可稳定输出5分钟级别的长视频,且无质量损失,为视频内容创作提供强大支持。
意外不意外
北京商报记者在与视频生成模型从业者沟通时了解到,同行对美团在视频生成模型领域的成绩表示“不意外”。视频模型大部分闭源,开源的少,达到开源SOTA不怎么有代表性。该人士还指出,“美团做这类模型不意外,美团自己有内容需求,而且视频生成模型有可能为具身提供模拟数据”,揭示美团布局AI视频模型的深层考量。
另一位大语言模型企业从业者则分享了比较模型能力的窍门,“可以看看同行反馈,如果同行在发布新模型的时候,愿意对比这个模型,那可能说明还不错。美团这个模型还得等等实际反馈,看看有没有达到官宣的效果”,为评估美团AI模型提供新视角。
根据美团援引的技术对比图,与Veo 3、Seedance 1.0 Pro等在文生、图生视频任务上的比较,LongCat-Video在136亿参数的视频生成基座模型,在文生视频、图生视频两大核心任务中,综合性能均达到当前开源领域SOTA级别;通过文本-视频对齐、视觉质量、运动质量、整体质量四大维度评估,其性能在文本对齐度、运动连贯性等关键指标上展现显著优势;在VBench等公开基准测试中,LongCat-Video在参评模型中整体表现优异,彰显其技术领先性。
文渊智库创始人王超则有不同看法,“美团跟大模型之间没有太必然的联系,尤其是视频大模型这款,即使客户有视频生成需求,但是需求可能没那么大”,引发对美团AI战略的深入思考。
为了“零售+科技”
站在自身业务之外看,美团在大模型赛道逐渐高调的态度似乎有了答案。加之美团发布此款模型时就强调了“世界模型”,展现其AI战略的前瞻性。
美团LongCat团队认为,此次发布的视频生成模型,是为探索“世界模型”迈出的第一步。未来,凭借精准重构真实世界运行状态的能力,LongCat模型也会融入公司近年来持续投入的自动驾驶、具身智能等深度交互业务场景中,成为公司更好连接“比特世界”和“原子世界”的技术基础,推动美团AI战略深入实施。
2024年,美团集团战略从“Food+Platform”升级为“零售+科技”,明确将AI、机器人、自动驾驶等作为未来核心方向。宇树科技、星海图、银河通用、它石智航等具身智能企业背后都有美团的影子,彰显其在AI领域的广泛布局。
“在具身智能赛道,美团冲劲十足。”王超说,肯定美团在AI领域的积极投入。
2024财年业绩发布会上,王兴首次阐述了公司的AI战略布局,主要通过三层架构推动技术落地:AI at Work,目标是利用AI工具提升超过10万名员工的工作效率;AI in Products,旨在用AI改造现有产品并创建原生AI应用;BuildingLLM,持续投入资源自研大模型。当时王兴就提到了LongCat大模型,称该模型结合外部模型为员工推出了多种AI工具,包括AI编程、智能会议、文档助手等,并透露LongCat API的调用量占比从上一年年初的10%增长到68%,展现美团AI战略的实际成效。
如今,不止一个美团大模型的落地应用已上线,前有AI图像生成应用“妙刷”,以及用于餐饮推荐、问答交互等场景的问小袋、米鲁等AI智能助手,后有AI编程应用NoCode,支持前端开发、数据分析、运营工具和门户网站生成等,为美团业务发展注入新动力。
(文章来源:北京商报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

