AI导读:

Deepseek应用由国产大模型公司杭州深度求索开发,成功登顶苹果中国地区与美国地区应用商店免费APP下载排行榜,展现出国产大模型的强大实力。Deepseek创始人梁文锋是量化私募幻方的创始人,其团队在AI领域取得了显著成就。

几乎一夜之间,“来自东方的神秘力量”再次令海外人士为之震撼。国产大模型领域的黑马——杭州深度求索公司开发的Deepseek应用,于1月27日成功登顶苹果中国地区与美国地区应用商店的免费APP下载排行榜,甚至在美国市场超越了ChatGPT,成为新的下载热门。

苹果美国区应用商店的榜单上,Deepseek的崛起尤为引人注目。

同时,在中国区免费榜上,Deepseek也占据了显眼的位置。

然而,据界面新闻报道,1月27日,DeepSeek官网出现短暂波动,网页/API暂时不可用。前一天(26日),DeepSeek还经历了短时闪崩现象。对此,DeepSeek官方迅速回应,承认当天下午确实出现了局部服务波动,但问题在极短时间内得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,导致服务器一时无法满足大量用户的并发需求。

Deepseek由量化巨头幻方量化旗下的大模型公司深度求索推出。今年1月20日,DeepSeek-R1推理大模型正式发布,凭借其高性价比在海外开发者社区中引起了巨大轰动。

值得一提的是,就在1月20日,国务院总理李强主持召开了专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。DeepSeek创始人梁文锋作为代表之一参加了此次座谈会。梁文锋不仅是深度求索(DeepSeek)的创始人,还是头部量化私募幻方的创始人,其创业领域横跨金融和人工智能两大板块。

(央视新闻截图,左一为梁文锋)

梁文锋,1985年出生于广东省湛江市。2002年,他考入浙江大学电子信息工程专业,并在随后的几年里继续深造,最终于2010年获得信息与通信工程硕士学位。在校期间,他就对金融市场产生了浓厚兴趣,特别是在2008年全球金融危机期间,他带领团队探索了机器学习技术在全自动量化交易中的应用,这一经历为他日后的职业生涯奠定了坚实基础。

毕业后,梁文锋将目光转向更广阔的金融市场。2013年,他与浙大同学徐进共同创立了杭州雅克比投资管理有限公司。两年后,他又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。在2015年的市场波动中,幻方依靠先进的高频量化策略取得了显著成绩。

2016年是幻方的重要转折点,公司推出了首个基于深度学习的交易模型,并实现了所有量化策略的AI化转型。2018年,幻方正式确立了以AI为核心的发展战略。然而,随着业务的快速扩展,算力瓶颈逐渐显现。为解决这一问题,2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。

2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年,梁文锋宣布正式进军通用人工智能领域,并创办了深度求索DeepSeek,专注于打造真正人类级别的人工智能。

2024年5月,DeepSeek发布了混合专家语言模型DeepSeek-V2。同年12月,DeepSeek-V3问世,这款性能优越且性价比极高的大语言模型,被谷同行誉为“来自东方的神秘力量”。DeepSeek-V3的出现极大地降低了大模型训练和应用的成本,其训练成本仅为557.6万美元,而OpenAI训练ChatGPT-4o的成本则高达7800万美元至1亿美元,双方的成本差距至少为10倍。

在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o,行业对此性价比表示震惊,DeepSeek-V3更是开源给全世界的技术开发团队。在团队配置上,DeepSeek团队仅有139名研发人员,而ChatGPT的OpenAI团队则有1200名研究人员,团队规模是DeepSeek的近9倍。近期热门话题“雷军千万年薪挖95后天才AI少女”中的AI少女便是DeepSeek团队的研发人员,但小米和当事人并未就此事作出回应。

通过招聘网站了解到,深度求索公司的北京子公司正在积极招聘人才,目前共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深UI设计师等,均为14薪。其中,薪资最高的为核心系统研发工程师(校招),薪资范围为6万元至9万元;除此之外,大部分岗位的起薪在2万元及以上。值得一提的是,该公司还在招聘实习生,AGI大模型实习生的工资为500元/天至1000元/天,数据百晓生实习生为500元/天至510元/天。

受DeepSeek崛起的影响,1月27日,DeepSeek概念股表现强劲。截至发稿,每日互动、华金资本、浙江东方涨停,并行科技、卓创资讯、拓尔思等股票也涨幅居前。此前,AMD宣布已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,旨在与SGLang一起实现最佳性能。

据华经产业研究院报告,2023年国内智能体市场规模已达59.81亿元,预计2024年将突破百亿元大关。中国工程院院士邬贺铨在2025年ICT行业趋势年会上表示,2025年不仅是智能体的元年,也将是AI终端的元年。

声明:本文内容和数据仅供参考,不构成任何投资建议。投资者据此操作,风险自担。

(文章来源:综合网络报道)