AI导读:

中国第三代自主超导量子计算机“本源悟空”成功实现全球首次运行十亿参数AI大模型微调任务,训练效果提升8.4%,为破解大模型“算力焦虑”开辟了新路径,对金融风控等领域具有深远影响。

  上证报中国证券网讯(记者刘怡鹤)4月7日,记者从安徽省量子计算工程研究中心获悉,本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关,成功推出中国第三代自主超导量子计算机“本源悟空”真机,并实现了全球首次运行十亿参数AI大模型微调任务。这一创新成果在参数量减少76%的前提下,训练效果反而提升了8.4%。这一突破性进展不仅验证了量子计算在助力实现大模型轻量化方面的可行性,更为解决大模型的“算力焦虑”问题开辟了全新的路径,对金融风控等领域具有深远影响。

  微调技术是指在通用大模型的基础上,通过进一步训练特定领域的数据,使其能够更好地适应医疗诊断、金融风控等专业场景。然而,传统低秩微调技术面临性能瓶颈和泛化能力有限等问题。而量子计算凭借其独特的叠加态和纠缠态特性,能够同时探索海量的参数组合,从而显著提升大模型微调的效率。

  “就好比给经典模型装上了‘量子引擎’,让两者协同发力。”本源量子副总裁窦猛汉表示,团队创新性地设计了“量子加权张量混合参数微调”技术,通过利用量子计算的特性实现智能微调。这一技术将模型权重转化为量子神经网络与张量网络混合架构,其中量子门操作负责提取高维非线性特征,而张量网络则负责压缩参数规模。

  在“本源悟空”的量子芯片上,单批次数据可以生成数百个量子任务进行并行处理。实验数据显示,经过优化后的模型在心理咨询对话数据集(CPsyCountD)上的训练损失降低了15%,而在数学推理任务(R1-Distill-SFT)上的严格准确率则从68%提升至82%。合肥综合性国家科学中心人工智能研究院副研究员陈昭昀补充道:“这是量子计算首次在真实环境中应用于大模型任务,证明了现有的硬件已经能够初步支撑大模型的微调工作。”

  据介绍,“本源悟空”是目前我国最先进的可编程、已交付的超导量子计算机,它已为全球超过2300万人次提供了量子算力云服务,完成了35万个量子运算任务,涵盖了流体动力学、金融、生物医药等多个行业领域。此外,它还成功完成了全球最大规模的量子计算流体动力学仿真,并接入了金融量子云实验平台,用于探索金融领域更高效的问题解决方案。

(文章来源:上海证券报·中国证券网)