DeepSeek-V3.2-Exp发布,AI技术革新引领新潮流
AI导读:
9月29日,DeepSeek-V3.2-Exp模型正式发布并开源,引入稀疏Attention架构提升效率。官方API价格下调,开发者成本降低超50%。DeepSeek频繁升级,展示中国AI领域竞争力。大模型训推带动AI算力需求,算力产业链环节有望受益。
9月29日,Deepseek-V3.2-Exp模型正式在Hugging Face平台发布并开源,这一AI技术革新引发了广泛关注。DeepSeek宣布官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,展现了其在AI领域的强劲实力。据悉,模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率,为AI发展注入新动力。目前,寒武纪、华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作。
DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上,进一步降低了AI开发的门槛。在AI技术浪潮中,DeepSeek频繁升级,就在9月22日晚,DeepSeek宣布,DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。官方发布的测试结果显示,该版本模型单项提升幅度最大超过36%,展现了其持续创新的能力。
而上述更新距V3.1发布仅一个月。8月21日,DeepSeek宣布发布DeepSeek-V3.1。当日,DeepSeek概念板块火热。随后,不少国产芯片产业链企业股价大涨,体现了市场对AI技术的热烈追捧。业内人士指出,在开源模型竞争趋于白热化的背景下,快速修复Bug、提升智能体能力将成为留住开发者的关键,DeepSeek正是这一趋势的引领者。
国盛证券金融工程团队分析师张国安在研报中分析指出,DeepSeek具备高性能、低成本、蒸馏有效、开源等核心优势,同时DeepSeek提出多项算法创新,打破了海外算力堆砌的传统大模型提升路径,展示出中国在AI领域已经具备与全球顶尖水平竞争的实力。国海证券发布研报称,大模型训推带动AI算力需求增长,GB300、Vera Rubin等新一代算力架构将推出,算力产业链中的AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节有望持续受益,为AI产业带来新的发展机遇。
(文章来源:21世纪经济报道)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

