AI导读:

  从“养虾”到“杀虾”,一款名叫“龙虾”的开源AI智能体OpenClaw近期持续成为社交平台热门话题。近年来,大模型驱动的智能体已成为人工智能开发机构争相布局的战略高地。从最初的“能对话”,到如今“可动手操作”,不断

  从“养虾”到“杀虾”,一款名叫“龙虾”的开源AI智能体OpenClaw近期持续成为社交平台热门话题。近年来,大模型驱动的智能体已成为人工智能开发机构争相布局的战略高地。从最初的“能对话”,到如今“可动手操作”,不断迭代的大模型将走向何方?

  提升推理能力是关键

  在相继推出旗舰模型GLM—4.5、GLM—4.6后,去年12月,北京智谱华章科技股份有限公司上线并推出新一代视觉推理模型GLM—4.6V,核心目标之一是提升推理能力。

  “让AI像人类一样综合感知、理解与决策,多模态推理能力的突破很关键,这也是大模型向通用人工智能演进的必由之路。”智谱联合创始人、董事长刘德兵说。

  无论是通用大模型还是行业大模型,推理能力是打造未来竞争力的关键指标,一定程度上决定了其应用广度和深度。

  北京航空航天大学人工智能研究院副研究员胡堃解释说,推理能力可理解为模型不仅知道“是什么”,还能判断“为什么”和“如何做”,并在复杂逻辑或跨领域条件下给出合理答案。“如果将大模型作为助手,传统大模型近似知识库型助手,回答用户提出的事实性问题;推理能力强的大模型更像策略型顾问,不仅能回答常规的经验问题,还能分析利弊、推演后果并综合多种因素给出具体建议”。

  对科学基础大模型来说,推理能力尤为重要。一方面,在数学、物理等领域,推理能力是解决定理证明和理论发现的关键基础;另一方面,面向各学科领域的复杂科研任务,推理能力是任务理解和规划决策的重要前提。

  “磐石·科学基础大模型一直坚持和重视推理能力的学习与强化。”中国科学院自动化研究所研究员张家俊介绍,如今磐石·科学基础大模型将数字幻觉(大模型生成看似合理但实则虚构或失真的信息)从30%降至11%,科学模态数据分析和理解能力全面提升。

  “随着应用场景日趋复杂,用户更需要大模型在不确定的条件下进行综合分析并作出合理判断与决策。眼下,推理能力是大模型规模化应用的竞争焦点。”胡堃表示。

  智能体成重要形态

  智能体是一个由“大模型+记忆系统+工具调用+规划能力”构成的智能系统,已成为开发机构发力重点:磐石大模型新增创新评估科学智能体,为科研选题、技术方案等科研决策提供支持;海康威视将AI和大模型融入研发、生产决策全流程,打造了系列智能体;北航在智能无人机系统中引入智能体,使无人机自主完成复杂的飞行任务……

  “当前,深化与拓展大模型核心能力,业内主要聚焦3个方面寻求突破。”胡堃介绍,一是进一步提升多步推理和因果推理能力;二是持续创新高效训练与推理算法,通过优化模型结构、改进训练策略等,显著降低大模型对高昂算力的依赖,推动其向更广泛的应用场景普及;三是不断增强大模型智能体化与自动化任务执行能力,让大模型能自主接收任务目标、规划执行路径、动态调整策略并完成连贯的复杂流程。

  “智能体能力意味着大模型不仅能给出实际可行的方案,还可从被动的信息提供者转变为主动的任务执行者。”胡堃说。

  在生产端,面对每日上万个订单,海康威视的计划智能体可快速下达生产计划和物料需求计划,实现订单24小时快速响应;其工艺智能体可自动推荐最优工艺,提升工艺设计效率。“大模型光有聪明的‘大脑’是不够的,从感知认知走向决策执行,智能体正成为大模型产品落地的重要应用形态。”张家俊说。

  在科研和工业领域,智能体带来的变革同样深刻。例如,为改变材料研发“大海捞针”式的局面,中国科学院基于磐石大模型构建的材料逆向设计系统智能体,已成功从2000万种新型析氢反应合金催化材料候选配方中,快速锁定13种高性能材料,并将原本需耗时数月的材料设计周期缩短至30分钟。

  提供更好交互体验

  “今天,用户早已不满足于简单的文字对话或文本生成,下一代大模型不仅可以理解文本、图像、视频、声音等多模态信息,还可理解现实世界的因果关系。”刘德兵说,当它具备了多模态理解能力和因果推理能力,就可以感知环境变化并主动调整行为,为用户提供更自然、直观和沉浸式的交互体验。

  刘德兵介绍,通用人工智能可分为L1预训练大模型、L2对齐与推理、L3自我学习、L4自我认知、L5意识智能5个等级。未来3年到5年,大模型领域的突破将主要围绕如何实现通用人工智能从L3自我学习向L4自我认知推进。最值得关注的是“沉思级”推理的实现,即模型能够自主分析复杂问题、生成优化方案,并在决策中进行自我批评和反思,而不再完全依赖人类输入。

  这需要坚实的技术支撑。张家俊表示,除了当前备受关注的推理能力、智能体外,大模型还在朝着多模态、后训练、通专融合(通用能力与专业能力融合)、代码生成等技术方向演进。

  其中,多模态旨在让模型从底层架构上学会同时理解和生成文本、音频、图像、视频以及其他模态信息;后训练旨在通过投入更多后训练资源,突破模型推理能力的上限;通专融合旨在充分利用超大模型的超强通用能力与领域模型的高效专业能力;代码生成既可提升软件研发等任务的效率,也是模型推理能力和智能体能力跃升的关键因素。

  科技创新的落脚点是满足人民对美好生活的向往。胡堃表示,要关注大模型的安全可解释性、隐私保护,以及社会接受度。“在不久的将来,大模型将进一步成为人类可靠的智能伙伴。”刘德兵说。

(文章来源:经济日报)