AI导读:

我国超导量子计算机“本源悟空”真机上实现十亿参数级AI大模型微调任务的全球首次运行,训练效果提升8.4%,验证了量子计算助力实现大模型轻量化的可行性,为破解大模型“算力焦虑”开辟了新路径。

  记者7日从安徽省量子计算工程研究中心获悉,本源量子计算科技(合肥)股份有限公司、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在我国超导量子计算机“本源悟空”真机上,实现十亿参数级AI大模型微调任务的全球首次运行。这一成果标志着我国在量子计算领域取得重大突破。

  实验结果显示,在参数量减少76%的前提下,训练效果反而提升8.4%。这一成果不仅验证了量子计算在大模型轻量化方面的巨大潜力,更为解决大模型面临的算力瓶颈问题提供了新的解决方案。量子计算以其独特的叠加态和纠缠态特性,能够高效探索海量参数组合,显著提升大模型微调的效率。

  微调技术是在通用大模型的基础上,通过进一步训练特定领域的数据,使其更好地适应医疗诊断、金融风控等专业场景。本源量子计算科技(合肥)股份有限公司副总裁窦猛汉介绍,团队创新性地设计了“量子加权张量混合参数微调”方法,将模型权重转化为量子神经网络与张量网络混合架构,实现了性能的大幅提升。

  实验数据显示,优化后的模型在心理咨询对话数据集(CPsyCountD)上的训练损失降低了15%,数学推理任务(R1-Distill-SFT)的严格准确率从68%提升至82%。这一成果充分展示了量子计算在提升AI模型性能方面的巨大优势。

  合肥综合性国家科学中心人工智能研究院副研究员陈昭昀表示:“这是量子计算首次在真实环境中成功应用于大模型任务,证明了现有硬件已初步具备支撑大模型微调的能力。”

  “本源悟空”作为我国先进的可编程、已交付的超导量子计算机,已为全球139个国家超过2300万人次提供了量子算力云服务,并成功完成了35万个量子运算任务。这一成果不仅彰显了我国在量子计算领域的领先地位,也为未来的科技创新和产业发展奠定了坚实基础。

(文章来源:科技日报)