AI导读:

在上海市宝山区智慧湾科创园,上海人工智能实验室开发的AI大模型书生·思客与人对弈,展示了其在围棋领域的专业水平。该模型通过新的训练方式,实现了在多个任务同步学习演进,是首个既具备围棋专业水平,又能展示透明思维链的大模型。

  近日,在上海市宝山区智慧湾科创园里,上演了一场人与AI大模型的围棋“智斗”。这场对弈展示了AI在围棋领域的最新进展。

  这个大模型名为书生·思客(InternThinker),由上海人工智能实验室开发,在围棋任务上展现了较强的专业水平,还能通过自然语言对弈过程进行“解说”。现场的小朋友排队等待与书生·思客对弈,活动因受欢迎而延迟半小时结束。

  自AlphaGo战胜李世石和柯洁后,围棋AI迅速发展,如绝艺、星阵、Katago等。书生·思客有何独特之处?工作人员介绍,它采用了一种新的训练方式,将搜索过程的状态建模转化为语言建模,让机器学习。

  上海人工智能实验室青年研究员李林阳表示,这种训练方式难度极大,因为大模型只能根据坐标而非画面来学习围棋术语,相当于进行“盲棋”训练。

  围棋被称为“手谈”,通过落子表达看法。而“盲棋”则完全依靠坐标来落子,挑战更大。为保证训练效果,上海人工智能实验室研究团队构建了一个“加速训练营”,使大模型持续进化,获得解决复杂推理任务的能力。

  书生·思客已实现在奥赛级数学、科学对象理解与推理、算法编程、棋类游戏等多个任务同步学习演进,并在多任务混合强化学习过程中出现智能“涌现时刻”。在实操中,书生·思客在与儿童对弈时均占上风。

  李林阳表示,团队的目标不仅在于提升棋力,更在于锻炼大模型的推理能力和逻辑思维,为后续完成更多专业任务打下基础。

  上海人工智能实验室率先提出的“通专融合”技术路线,旨在解决大模型高度专业化和通用泛化性相互制约的问题。书生·思客大模型在围棋任务上已超越不少国内外主流大模型,是首个既具备围棋专业水平,又能展示透明思维链的大模型。

(文章来源:上海证券报)