DeepSeek一年:从低成本推理到中美AI竞赛新图景
DeepSeek从低成本推理模型震撼全球,到在底层架构上酝酿新一轮突破,勾勒出中美AI竞赛的新图景。其新一代旗舰模型V4预计将在2026年春节期间发布。...
阿里发布Qwen3-Next架构及系列模型,展现高效性价比
9月12日阿里发布下一代基础模型架构Qwen3-Next,开源Qwen3-Next-80B-A3B系列模型。该架构有核心改进,Qwen3-Next-80B-A3B-Base模型参数多但激活参数少,性能好且训练成本低。...
具身模型发展:模型架构与数据样方的双重挑战
中信证券指出,具身模型规模化发展面临模型架构与数据样方两大挑战。模型架构融合大语言、视觉与动作模型,数据样方理念兴起,合成数据与互联网数据价值凸显。建议关注资本布局者及云计算算力提供者。...


