AI导读:

随着大型模型进入规模化应用阶段,行业大模型在金融等领域密集发布,展现其在特定场景下的商业价值,但技术投入和数据问题仍是挑战。

巨大技术投入的最终目标是创造商业价值。随着大型模型进入规模化应用阶段,近期,多个行业大型模型密集发布。2024年12月底,百川智能推出了全链路领域增强的金融大型模型Baichuan4-Finance,与此同时,中关村科金也发布了助大型模型平台2.0,更早之前,奇富科技已宣布将大型模型引入小微金融场景。

与巨头在通用大型模型领域的算力与技术竞争相比,特定场景的行业大型模型显得更为贴近实际。2024年,众多云厂商因一线业务场景需求,纷纷寻求合作以构建大型模型产品并获取用户反馈。

中国工程院院士、清华大学计算机科学与技术系教授郑纬民指出,通用大型模型不需要过多,全国三四个已足够。他认为,大型模型下一步的发展关键在于如何更好地应用,并构建更优质的软件生态。

技术投入难以持续高涨

算力、算法、数据是大型模型发展的三大核心要素。其中,算力和数据被视为现阶段企业间的主要壁垒。随着大型语言模型规模的不断扩大,参数甚至达到万亿级别,一次训练所需的资金、人力和稳定性能源成本愈发高昂。

郑纬民指出,基础大型模型需要巨大的计算量,包括大规模的显卡、计算和存储资源,而特定场景的行业模型则无需如此庞大的计算量。他举例一家知名大型模型创业公司,该公司追求数据更多、模型更大、上下文窗口更长,以获得更佳输出效果,但这也导致了推理负载增加,存储器超负荷,存在宕机风险。

据业内人士透露,大型模型的训练与推理环节成本高昂,尤其是训练成本。尽管随着技术迭代,推理成本在2024年已显著降低,但整体成本仍令多数机构难以承受。

数据问题也是大型模型发展的另一大瓶颈。Epoch AI Research预测,到2026年,现存的高质量语言数据将耗尽。信息技术分析公司Gartner的研究报告也指出,到2030年,合成数据将成为AI模型的主要训练数据来源。

市场普遍认为,大型模型行业的发展已从快速增长阶段进入精细化落地阶段。郑纬民认为,大模型时代的两大特点是AI基础模型从单模态向多模态发展,以及大模型加速行业智能化升级。他预计,研发大模型的企业、推动大模型应用落地的企业,以及支持大模型计算系统的企业将在这一时代脱颖而出。

场景应用追求商业价值

2024年11月,央行、国家发展改革委等联合发布的《推动数字金融高质量发展行动方案》强调“强化数字技术支撑能力”以助力金融业数字化转型,并提出“运用数字技术提升重点领域金融服务质效”,这为金融机构推动AI落地提供了强大动力。

恒生研究院的市场调研数据显示,2024年前三季度,我国公开披露的大型模型项目中标总额达到20.75亿元,较2023年全年增长163%。其中,金融行业的大型模型中标项目数量为66个,项目金额达1亿元,占比4.9%。截至2024年11月,金融行业的大型模型中标项目数量已增至103个,项目金额也增至2亿元。

尽管金融行业在大型模型应用中的占比不算高,但由于其对技术和安全标准的要求更高,因此能在金融领域应用的大型模型能力往往具备向其他领域迁移的条件。

一位金融科技公司高管透露,公司在2023年制定目标时,就明确要找到大型模型在金融科技领域的最佳应用。

奇富科技首席算法科学家费浩峻表示,大型模型的成功,技术占40%,对业务场景的理解和深耕则占60%。他认为,应用场景、数据飞轮、智能体是大型模型产品的三个必要条件。

中关村科金总裁喻友平认为,“平台+应用+服务”的模式是企业大型模型落地的最佳路径。他指出,大型模型平台之间的差异主要体现在算力大小、模型响应速度以及以智能体为代表的应用构建能力上。在智能体应用构建中,场景模板是关键因素之一。

喻友平解释,虽然对场景价值和知识能力的理解方法论是通用的,但数据和行业场景并不通用。例如,保险销售和财富产品销售的外呼场景就不能通用,因为它们的流程不同。然而,在一定条件下,这种场景能力有可能实现迁移,尤其是在营销获客方面。

目前,大型模型在金融行业主要用于内部赋能以及客服、外呼、获客等业务环节。喻友平透露,以智能营销场景的大型模型外呼为例,公司在某家装平台的活动营销转化率达到了3.5%,较传统AI外呼大幅提升130%,与人工座席相比仅差17%;在智能运营环节,金融场景业务中综合线索留资率提升了19.8%。

费浩峻透露,目前已将AI能力和金融大型模型集成到新的信贷业务系统Focuspro2.0中,该系统既能支持消费贷业务,也能支持小微金融业务,并能有效识别欺诈风险。

不过,也有业内人士透露,一些大型模型在金融业务中使用初期效果较好,但随着迭代次数增加,效果出现不稳定。这要求深入一线与业务团队不断沟通,持续强化相关领域。(文章来源:中国经营报)