AI导读:

多家银行及券商接入DeepSeek,通过部署DeepSeek实现AI支出降本增效。专家指出,DeepSeek的出现产生了鲇鱼效应,但仍面临数据安全、模型幻觉等挑战。金融机构需综合考虑算力、预算等因素,因“材”施策。

截至2月11日,有北京银行、江苏银行、苏商银行、重庆农村商业银行等多家银行及国泰君安等头部券商“尝鲜”Deepseek。恒生电子、金证股份、星环科技等金融科技服务公司的大模型服务也接入了DeepSeek。

通过部署DeepSeek,一些金融机构看到了AI支出“降本增效”的可能性。专家表示,DeepSeek的出现在通用大模型领域产生了很强的“鲇鱼效应”,但从“好用”到“用好”,仍面临数据安全、恶意训练、模型幻觉等挑战。

日前,北京银行宣布全面启动“all in AI”战略,携手华为率先实现DeepSeek全栈国产化金融应用。江苏银行依托“智慧小苏”大语言模型服务平台,本地化部署微调DeepSeek-VL2多模态模型、轻量DeepSeek-R1推理模型,分别运用于智能合同质检和自动化估值对账场景。重庆农村商业银行借助腾讯云大模型知识引擎的能力,在企业微信上线基于DeepSeek模型的智能助手应用“AI小渝”。

据公开信息,接入DeepSeek的金融机构类型涵盖银行、证券、基金、非银行支付机构等。目前,多家银行已实现DeepSeek系列大模型本地化部署,应用场景包括智能合同管理、客服助手等。

移卡执行董事、CTO罗小辉表示,移卡在2024年初就本地化部署了DeepSeek coder,在此基础上,移卡开发了编码助手,其功能包括代码撰写、代码纠错等。“DeepSeek是目前开源最彻底的大模型厂商,性能和效率俱佳。”罗小辉坦言,移卡准备长期使用以DeepSeek为代表的开源大模型,逐步替换海外AI产品的大模型服务,这将在保证质量的前提下大大降低应用成本。

奇安信银行行业负责人徐懿巍认为,训练成本更低,性能更强,完全开源、支持免费商用等优势,使DeepSeek在垂直行业更容易落地。

优智科技创始人兼CEO詹毅称,对大模型应用而言,2024年更多是头部机构积极推动大模型落地,2025年在DeepSeek的认知普及和更多金融标杆案例的推动下,中小机构大模型应用将提速,市场将大幅扩容。

恒生电子、星环科技、金证股份等金融科技服务商的大模型服务正加速接入DeepSeek。例如,恒生大模型系列应用全面接入DeepSeek主流模型(DeepSeek-V3/DeepSeek-R1),覆盖金融投研、投顾、合规、运营、投行等核心业务场景;星环科技大模型运营管理平台Sophon LLMOps全面支持DeepSeek-R1全参版本及蒸馏版本,可用于智能投研与策略支持、智能运营与流程再造等智能金融场景。其测试数据也印证了这一趋势。

以恒生电子为例,实测数据显示,在金融高密度数据处理场景中,依托DeepSeek-R1的千亿级参数压缩和蒸馏技术,本地部署算力资源消耗降低50%;基于DeepSeek独创的MoE(混合专家)架构,客户需求解析速度加快3倍。

张晓明坦言,整个大模型市场还是一个多元需求的市场,目前已有金融客户用星环科技大模型运营管理平台Sophon LLMOps适配了70多个主流模型,可适应不同业务场景的需求,“DeepSeek热浪下,应该思考如何将大模型转化为生产力”。

恒生电子首席科学家、恒生研究院院长白硕称,DeepSeek擅长慢思考,在需要快慢思考结合的具体应用场景中,通义千问和DeepSeek可以相得益彰,发挥更大的效果。

专家表示,金融机构由于其业务性质,对数据的安全性、隐私保护及合规性有着极高要求,因此在部署大模型时也面临更大挑战。

徐懿巍表示,金融领域大模型往往包含复杂的算法和市场分析能力,开发成本较高,并承载重要业务和数据,自身安全性的重要性不言而喻。在OWASP发布的大模型应用十大安全风险中,“提示注入”位居首位。攻击者可通过设计特定的提示词来误导大模型产生错误的结果,特别是涉及投资决策、风险管理等关键领域时,这种攻击可能导致重大经济损失。

金融行业大模型的幻觉问题也是一大安全隐患。大模型生成的内容有时可能与现实不符,这对于高度依赖准确信息的金融行业来说,是一个潜在的风险,尤其在提供市场预测、风险评估或投资建议时,其危害不容忽视。

罗小辉表示,考虑到模型对于资源的需求较多,大多采用混合部署的方式,即部分本地化、部分外部接口的方式。正在密切关注大模型的小型化方案,期待通过这种方式来缓解资源压力。

张晓明建议,金融机构部署DeepSeek要综合考虑算力、预算和基础设施的投入情况,因“材”施策。

(文章来源:上海证券报)