GDC盛会透视：大模型技术迭代加速，中美竞争白热化

财经聚焦 2025-02-23 06:58:04 来源：上观新闻作者：网络

AI导读：

2025年GDC盛会吸引全球开发者关注，大模型技术迭代速度惊人，中美竞争白热化。DeepSeek创新算法降低计算成本，展示中国开源力量。大模型研发框架迅速迭代，未来竞争将更加激烈。

2025年2月22日，全球开发者先锋大会（GDC）盛大开幕，吸引了全球科研及产业领域的开发者。据主办方透露，备受瞩目的Deepseek也低调参会，以“闭门会议”形式亮相。GDC成为观察大模型最新进展和未来趋势的重要平台，记者与参会厂商及专家深入交流，探讨业界三大热议话题。

一、大模型“撞墙”疑虑消散？近一年来，外界对大模型技术和性能天花板的担忧持续存在。然而，业内普遍认为大模型迭代速度惊人。回顾去年，OpenAI的视频生成模型Sora横空出世，给国内大模型创业公司带来巨大压力。但一年后的今天，局势逆转，MiniMax旗下海螺AI在全球月访问量排名中跃居榜首，Sora仅列第三。

事实上，大模型几乎每三个月就能带来一次“行业震惊”。如OpenAI发布的GPT-4o，已具备感知和响应用户情绪的能力。未来，随着算法创新和多模态融合的发展，大模型的能力有望进一步提升，性能跃升空间巨大。

二、中美大模型技术差距缩小？春节期间，DeepSeek凭借其创新的“烧脑改算法”，采用混合专家模型（MoE）架构，通过动态冗余策略大幅降低计算成本。同时，DeepSeek在模型蒸馏和算力调度方面的独特做法，展示了中国的开源力量和创新策略。中美大模型之间的竞争依然激烈，但中国模型的技术实力已不容忽视。

三、大模型研发框架迭代加速？短短两年内，大模型研发框架迅速迭代。从最初的稠密模型加Transformer架构，到如今Transformer几乎被弃用，模型公司更倾向于选择稀疏激活和更为经济有效的MoE模式。DeepSeek率先垂范，不再依赖经验和专家，而是大量聘用年轻研究员并给予充分授权。大模型技术的颠覆性变革不断刷新业界认知，意味着大厂和创业公司需组建高效研发团队，以应对激烈竞争。

（文章来源：上观新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。