DeepSeek宣布开源新文件系统及数据处理框架
AI导读:
DeepSeek在“开源周”最后一天宣布开源Fire-Flyer文件系统(3FS)及Smallpond数据处理框架,旨在提升数据访问速度和处理能力。DeepSeek-R2模型加速开发,或将提前发布,为AI行业带来新期待。
2月28日,在“开源周”第五天,Deepseek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。这一举措标志着DeepSeek在技术共享方面迈出了重要一步。
Fire-Flyer文件系统(3FS)是一种利用现代SSD和RDMA网络的并行文件系统,旨在提升数据访问速度。它是所有DeepSeek数据访问的助推器,具有卓越的性能表现。在180节点集群中,其聚合读取吞吐量高达6.6TiB/s;而在25节点集群中,GraySort基准测试的吞吐量达到了3.66TiB/min。每个客户端节点的KVCache查找峰值吞吐量也超过了40GiB/s。此外,3FS还具有强一致性语义的分解架构,并支持在V3/R1中进行训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和KVCache查询推理。
Smallpond则是DeepSeek推出的轻量级数据处理框架,它基于DuckDB,具有高性能数据处理可扩展性,能够轻松处理PB级别数据集,无需持续运行的服务。其操作简便,为用户提供了极大的便利。

至此,DeepSeek为期五天的“开源周”活动圆满结束。此次活动展示了DeepSeek在技术创新和共享方面的决心。
回顾整个“开源周”,DeepSeek先后宣布了多个开源项目。从2月24日起,他们陆续开源了FlashMLA、DeepEP、DeepGEMM和Optimized Parallelism Strategies等项目,涵盖了MLA解码、MoE模型训练和推理、矩阵运算以及并行策略优化等多个领域。
开年以来,DeepSeek备受瞩目。据QuestMobile数据显示,自上线以来至2月9日,DeepSeek App的累计下载量已超1.1亿次,周活跃用户规模最高近9700万个。这一数据充分展示了DeepSeek在用户心中的地位和影响力。
此外,有消息称DeepSeek-R2模型正在加速开发,或将提前发布。这一新模型有望能生成更好的代码,并使用英语之外的语言进行推理。对此,DeepSeek母公司幻方量化表示,以官方消息为准。这一消息无疑为AI行业带来了新的期待。
印度科技服务商Zensar的首席运营官认为,DeepSeek-R2模型的发布或将成为AI行业的关键时刻。DeepSeek成功打造的具有高性价比的AI模型将促使全球公司加速研发进程,有望打破目前少数企业垄断的格局。
当前,AI行业正蓬勃发展。OpenAI、谷歌、xAI、Anthropic、阿里等已相继推出深度推理/深度思考模型。而字节跳动旗下AI助手豆包也被传正在小范围测试深度思考模型的不同实验版本。然而,这些模型并未接入DeepSeek模型,显示了DeepSeek在AI领域的独特地位。
(文章来源:中国基金报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

