OpenAI推出ChatGPT智能体系统:自主调用电脑资源执行任务
AI导读:
OpenAI推出ChatGPT智能体系统,融合Operator与Deep Research优势,可自主调用电脑资源执行任务,包括买西装、做贴纸、订酒店等,用户可主动与网站互动,执行重要操作前会请求权限。
ChatGPT可以自主调用电脑资源执行任务了。
当地时间7月17日,人工智能(AI)巨头OpenAI推出ChatGPT智能体(Agent)系统,OpenAI CEO山姆·奥特曼(Sam Altman)和四位负责人进行了25分钟的直播。
据介绍,这是一套融合Operator远程浏览器执行能力、Deep Research网络信息整合技术以及ChatGPT对话优势的统一智能体平台,“可以思考和行动,能够主动从代理技能工具箱中进行选择,使用自己的计算机为您完成任务”。
奥特曼表示,智能体代表了AI系统能力的新高度。
此前,Operator和Deep Research各有优势:Operator可以在网页上处理内容,而Deep Research则擅长分析和汇总信息。但Operator无法深入分析或撰写详细报告,而Deep Research无法与网站互动以优化结果或访问需要用户身份验证的内容。此次,OpenAI直接将两者的优势进行了结合。
ChatGPT在Agent模式中会使用自己的“虚拟电脑”执行任务,基于用户指令处理复杂的工作,用户可以主动与网站互动,或在同一聊天中直接从对话过渡到直接请求操作。
在发布会上,OpenAI演示了用ChatGPT Agent同时进行买西装、做贴纸、订酒店等任务,Agent使用数秒启动虚拟电脑后便会询问用户明确需求,再进行衣服的挑选,Agent会滑动网页、点开商品详情,并留下相应的建议文字。此外,Agent也可以代替用户进行下单操作。

在“虚拟电脑”中,即使ChatGPT使用多种工具,也能保留任务所需的上下文,模型可以选择使用文本浏览器或可视化浏览器打开页面,从网络下载文件,通过在终端中运行命令进行操作,然后在可视化浏览器中查看输出。
同时,ChatGPT在执行重要操作之前会请求权限,用户可以随时中断、控制浏览器或停止任务。用户也可以安排已完成的任务自动重复,比如每周一早上生成每周报告。
在“人类最后一次考试”评估中,ChatGPT agent模型的SOTA(State of the arts,领域内最高水准)得分达到了41.6,当采用简单的并行部署策略(一次最多运行八次尝试,并选择自评置信度最高的一次)进行扩展时,得分提升至44.4。
此外,在FrontierMath等基准测试中,ChatGPT Agent的准确率也远超之前的模型。

Pro、Plus和Team用户可以使用Agent模式。企业版和教育版用户将在未来几周内获得访问权限。目前Pro用户每月有400次使用次数,其他付费用户每月有40次使用次数,也可以付费获得更多使用量。
(文章来源:澎湃新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

