上海AI大模型书生·思客围棋“智斗”引关注

商业视界 2025-06-03 06:58:47 来源：上海证券报作者：网络

AI导读：

在上海市宝山区智慧湾科创园，上海人工智能实验室开发的AI大模型书生·思客与人对弈，展示了其在围棋领域的专业水平。该模型通过新的训练方式，实现了在多个任务同步学习演进，是首个既具备围棋专业水平，又能展示透明思维链的大模型。

　　近日，在上海市宝山区智慧湾科创园里，上演了一场人与AI大模型的围棋“智斗”。这场对弈展示了AI在围棋领域的最新进展。

　　这个大模型名为书生·思客（InternThinker），由上海人工智能实验室开发，在围棋任务上展现了较强的专业水平，还能通过自然语言对弈过程进行“解说”。现场的小朋友排队等待与书生·思客对弈，活动因受欢迎而延迟半小时结束。

　　自AlphaGo战胜李世石和柯洁后，围棋AI迅速发展，如绝艺、星阵、Katago等。书生·思客有何独特之处？工作人员介绍，它采用了一种新的训练方式，将搜索过程的状态建模转化为语言建模，让机器学习。

　　上海人工智能实验室青年研究员李林阳表示，这种训练方式难度极大，因为大模型只能根据坐标而非画面来学习围棋术语，相当于进行“盲棋”训练。

　　围棋被称为“手谈”，通过落子表达看法。而“盲棋”则完全依靠坐标来落子，挑战更大。为保证训练效果，上海人工智能实验室研究团队构建了一个“加速训练营”，使大模型持续进化，获得解决复杂推理任务的能力。

　　书生·思客已实现在奥赛级数学、科学对象理解与推理、算法编程、棋类游戏等多个任务同步学习演进，并在多任务混合强化学习过程中出现智能“涌现时刻”。在实操中，书生·思客在与儿童对弈时均占上风。

　　李林阳表示，团队的目标不仅在于提升棋力，更在于锻炼大模型的推理能力和逻辑思维，为后续完成更多专业任务打下基础。

　　上海人工智能实验室率先提出的“通专融合”技术路线，旨在解决大模型高度专业化和通用泛化性相互制约的问题。书生·思客大模型在围棋任务上已超越不少国内外主流大模型，是首个既具备围棋专业水平，又能展示透明思维链的大模型。

（文章来源：上海证券报）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。