AI导读:

国产大模型企业深度求索(DeepSeek)创始人梁文锋出席总理座谈会,讨论国产大模型的发展与前景。DeepSeek在技术成本、性能上取得显著突破,备受科技界关注。

20日下午,国务院总理李强主持召开了一场专家、企业家及教科文卫体等领域代表座谈会,旨在广泛听取对《政府工作报告(征求意见稿)》的宝贵意见和建议。此次会议引起了市场的高度关注。

值得注意的是,国产大模型企业深度求索(Deepseek)的创始人梁文锋也应邀出席了此次座谈会。梁文锋不仅是深度求索的掌舵人,同时也是头部量化私募幻方的创始人,其创业足迹横跨金融与人工智能两大前沿领域。

市场尤为好奇的是,梁文锋在这场新年首场总理座谈会上究竟发表了哪些见解?据多方消息透露,座谈的核心议题聚焦于国产大模型的发展与未来前景。

梁文锋的个人履历同样引人注目。他17岁便考入浙江大学,30岁时创办了幻方量化,并在2021年成功将公司规模推升至千亿级别,这一年他年仅36岁。随后,在2023年7月,他又创立了深度求索(DeepSeek)。据公开资料显示,深度求索是国内少有的拥有万卡集群算力的AI大模型公司。

深度求索(DeepSeek)在国内外的影响力似乎已超越了幻方量化。成立仅一年半后,其国产大模型DeepSeek-V3便在2024年底风靡全球。这无疑是梁文锋受邀出席新年首场总理座谈会的重要原因之一。

DeepSeek之所以备受科技界瞩目,关键在于DeepSeek-V3的出现极大地降低了大模型训练和应用的成本。据悉,DeepSeek-V3的训练成本仅为557.6万美元,而OpenAI训练ChatGPT-4o的成本则高达7800万美元至1亿美元之间,双方的成本差距至少达到10倍。

在性能方面,DeepSeek-V3在数学、代码能力和中文知识问答方面均超越了ChatGPT-4o,这一高性价比令行业震惊。DeepSeek-V3已开源给全球的技术开发团队,因此被誉为“AI界的拼多多”。

在团队配置上,DeepSeek团队虽然仅有139名研发人员,但相比之下,ChatGPT的OpenAI团队则拥有1200名研究人员,团队规模是DeepSeek的近9倍。近期热门话题“雷军千万年薪挖95后天才AI少女”中的AI少女便是DeepSeek团队的一员。

就在1月20日,深度求索(DeepSeek)正式发布了DeepSeek-R1模型。该模型在数学、代码、自然语言推理等任务上的性能与OpenAI的GPT-4o正式版不相上下。DeepSeek透露,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型的推理能力。不仅如此,DeepSeek还将R1训练技术全部公开,并蒸馏了6个小模型开源给社区,允许用户借此训练其他模型。

尽管DeepSeek在技术上取得了显著突破,但根据此前资料显示,该公司目前尚无商业化的打算。

对于国产大模型公司代表受邀参加总理座谈会这一事件,业内普遍解读为国家对科技创新的高度重视。值得一提的是,李强总理在座谈会上强调,要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。

(文章来源:财联社)