豆包大模型发布UI-TARS-1.5,引领AI技术前沿
4月17日,豆包大模型团队发布并开源了UI-TARS-1.5,这是一款基于视觉-语言模型构建的开源多模态智能体。该模型在7个GUI评测基准中取得SOTA表现,并展示了卓越的游戏长时推理能力和开放空间交互能力,为AI技术树立了新标杆。...
4月17日,豆包大模型团队发布并开源了UI-TARS-1.5,这是一款基于视觉-语言模型构建的开源多模态智能体。该模型在7个GUI评测基准中取得SOTA表现,并展示了卓越的游戏长时推理能力和开放空间交互能力,为AI技术树立了新标杆。...