AI导读:

DeepSeek在“开源周”最后一天宣布开源Fire-Flyer文件系统(3FS)及Smallpond数据处理框架,旨在提升数据访问速度和处理能力。DeepSeek-R2模型加速开发,或将提前发布,为AI行业带来新期待。

  2月28日,在“开源周”第五天,Deepseek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。这一举措标志着DeepSeek在技术共享方面迈出了重要一步。

  Fire-Flyer文件系统(3FS)是一种利用现代SSD和RDMA网络的并行文件系统,旨在提升数据访问速度。它是所有DeepSeek数据访问的助推器,具有卓越的性能表现。在180节点集群中,其聚合读取吞吐量高达6.6TiB/s;而在25节点集群中,GraySort基准测试的吞吐量达到了3.66TiB/min。每个客户端节点的KVCache查找峰值吞吐量也超过了40GiB/s。此外,3FS还具有强一致性语义的分解架构,并支持在V3/R1中进行训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和KVCache查询推理。

  Smallpond则是DeepSeek推出的轻量级数据处理框架,它基于DuckDB,具有高性能数据处理可扩展性,能够轻松处理PB级别数据集,无需持续运行的服务。其操作简便,为用户提供了极大的便利。

  至此,DeepSeek为期五天的“开源周”活动圆满结束。此次活动展示了DeepSeek在技术创新和共享方面的决心。

  回顾整个“开源周”,DeepSeek先后宣布了多个开源项目。从2月24日起,他们陆续开源了FlashMLA、DeepEP、DeepGEMM和Optimized Parallelism Strategies等项目,涵盖了MLA解码、MoE模型训练和推理、矩阵运算以及并行策略优化等多个领域。

  开年以来,DeepSeek备受瞩目。据QuestMobile数据显示,自上线以来至2月9日,DeepSeek App的累计下载量已超1.1亿次,周活跃用户规模最高近9700万个。这一数据充分展示了DeepSeek在用户心中的地位和影响力。

  此外,有消息称DeepSeek-R2模型正在加速开发,或将提前发布。这一新模型有望能生成更好的代码,并使用英语之外的语言进行推理。对此,DeepSeek母公司幻方量化表示,以官方消息为准。这一消息无疑为AI行业带来了新的期待。

  印度科技服务商Zensar的首席运营官认为,DeepSeek-R2模型的发布或将成为AI行业的关键时刻。DeepSeek成功打造的具有高性价比的AI模型将促使全球公司加速研发进程,有望打破目前少数企业垄断的格局。

  当前,AI行业正蓬勃发展。OpenAI、谷歌、xAI、Anthropic、阿里等已相继推出深度推理/深度思考模型。而字节跳动旗下AI助手豆包也被传正在小范围测试深度思考模型的不同实验版本。然而,这些模型并未接入DeepSeek模型,显示了DeepSeek在AI领域的独特地位。

(文章来源:中国基金报)