优秀财经网 优秀的人都在用的资讯工具

全球指数

首页 > TAG信息列表 > 底层架构
  • DeepSeek一年:从低成本推理到中美AI竞赛新图景

    DeepSeek从低成本推理模型震撼全球,到在底层架构上酝酿新一轮突破,勾勒出中美AI竞赛的新图景。其新一代旗舰模型V4预计将在2026年春节期间发布。...

    2026-01-22
  • DeepSeek提出mHC架构,或引领AI大模型底层架构新方向

    DeepSeek在新论文中提出了名为mHC的新网络架构,旨在解决传统架构在大规模模型训练中的不稳定性问题。该架构通过加宽信息通道并添加“智能调节阀”,使模型训练更稳定、更易扩展,或能为下一代基础架构的演进指明新方向。...

    2026-01-01