AI导读:

2025年GDC盛会吸引全球开发者关注,大模型技术迭代速度惊人,中美竞争白热化。DeepSeek创新算法降低计算成本,展示中国开源力量。大模型研发框架迅速迭代,未来竞争将更加激烈。

2025年2月22日,全球开发者先锋大会(GDC)盛大开幕,吸引了全球科研及产业领域的开发者。据主办方透露,备受瞩目的Deepseek也低调参会,以“闭门会议”形式亮相。GDC成为观察大模型最新进展和未来趋势的重要平台,记者与参会厂商及专家深入交流,探讨业界三大热议话题。

一、大模型“撞墙”疑虑消散?近一年来,外界对大模型技术和性能天花板的担忧持续存在。然而,业内普遍认为大模型迭代速度惊人。回顾去年,OpenAI的视频生成模型Sora横空出世,给国内大模型创业公司带来巨大压力。但一年后的今天,局势逆转,MiniMax旗下海螺AI在全球月访问量排名中跃居榜首,Sora仅列第三。

事实上,大模型几乎每三个月就能带来一次“行业震惊”。如OpenAI发布的GPT-4o,已具备感知和响应用户情绪的能力。未来,随着算法创新和多模态融合的发展,大模型的能力有望进一步提升,性能跃升空间巨大。

二、中美大模型技术差距缩小?春节期间,DeepSeek凭借其创新的“烧脑改算法”,采用混合专家模型(MoE)架构,通过动态冗余策略大幅降低计算成本。同时,DeepSeek在模型蒸馏和算力调度方面的独特做法,展示了中国的开源力量和创新策略。中美大模型之间的竞争依然激烈,但中国模型的技术实力已不容忽视。

三、大模型研发框架迭代加速?短短两年内,大模型研发框架迅速迭代。从最初的稠密模型加Transformer架构,到如今Transformer几乎被弃用,模型公司更倾向于选择稀疏激活和更为经济有效的MoE模式。DeepSeek率先垂范,不再依赖经验和专家,而是大量聘用年轻研究员并给予充分授权。大模型技术的颠覆性变革不断刷新业界认知,意味着大厂和创业公司需组建高效研发团队,以应对激烈竞争。

(文章来源:上观新闻)