智谱发布原生多模态Coding基座模型GLM-5V-Turbo
4月2日,智谱发布原生多模态Coding基座模型GLM-5V-Turbo,支持AI Agent走向实用化。该模型能融合视觉与编程能力,处理多模态信息,并在多个场景中实现性能提升。...
智谱发布多模态Coding基座模型GLM-5V-Turbo
智谱发布GLM-5V-Turbo多模态Coding基座模型,该模型融合视觉与编程能力,处理多模态信息,擅长复杂任务。在核心基准上表现领先,引入视觉能力同时保持纯文本编程与推理能力。已开放接入智谱MaaS平台。...
智谱官微发布GLM-5V-Turbo
智谱官微4月2日宣布发布GLM-5V-Turbo,这是一个面向视觉编程的多模态Coding基座模型,具备原生多模态Coding基座,兼顾视觉与编程能力,并深度适配Claude Code与龙虾场景。...
中国经营报:AI发展从“玩具”到“工具”,多模态融合成趋势
中国信息通信研究院人工智能研究所博士樊威表示,AI发展从“玩具”到“工具”,多模态融合成趋势。大模型发展注重实用性而非规模。此外,他强调了数据安全、算力管制以及生态建设的重要性。对于AI安全性问题,樊威建议加大安全投入并发展安全预警技术。...
美团发布并全面开源原生多模态大模型 LongCat-Next
美团发布并全面开源原生多模态大模型 LongCat-Next,该模型打破了传统架构,将图像、语音与文本统一映射为同源的离散 Token,通过“下一个 Token 预测”范式,让视觉与语音成为 AI 的“原生母语”。...
商汤科技AI技术取得突破,迎接AI规模化爆发
商汤科技在AI技术方面取得突破,CEO徐立表示语言与视觉的深度融合是突破智能上限的高效路径。公司2025年收入创历史新高,生成式AI业务收入大幅增长。未来,商汤将继续深耕产业智能化,推动AI从辅助工具进化为生产力。...
AI技术重塑产业格局:多模态世界模型与自动化研发
中信建投和OpenAI等公司在AI技术领域取得新进展,多模态世界模型与自动化研发有望重塑产业格局。这些技术将推动AI在金融、法律等垂直场景的深度渗透,并加速商业化落地。...
字节跳动发布豆包大模型2.0系列,强化多模态理解能力
2月14日,字节跳动发布豆包大模型2.0系列,提供三款不同尺寸的通用Agent模型,全面升级多模态理解能力,并强化了LLM与Agent能力,广泛应用于生活场景。同时,Seedance2.0和Seedream5.0也提升了视频生成和图像创作的能力。...
豆包视频生成模型Seedance 2.0 升级:支持多模态可控生成
豆包视频生成模型Seedance 2.0 已正式接入豆包App、电脑端和网页版,支持原声音画同步、多镜头长叙事、多模态可控生成,但暂不支持上传真人图片作为主体参考。...
商汤科技开源多模态自主推理模型Sense Nova-MARS
商汤科技于1月29日正式开源了多模态自主推理模型Sense Nova-MARS,该模型支持动态视觉推理和图文搜索深度融合,能自己规划步骤、调用工具,让AI具备“执行能力”。...
AI漫剧接棒短剧成为新增长极
中信建投研报指出,AI技术在多模态工具中的应用正在从娱乐转向生产力,AI漫剧成为新的增长极。AI加速IP影视化进程,有望重塑广告与游戏资产生产逻辑。未来,原生多模态与世界模型技术将共同演进,重塑多个下游产业格局。...
2025年AI行业展望:多模态、AI Agent与具身智能成焦点
2025年上半年,AI初创企业吸纳全球53%风险投资。启明创投发布AI十大展望,涵盖多模态、AI Agent、AI应用、具身智能等趋势。预测未来一到两年,200万Token上下文窗口成标配,通用视频模型将出现,AI员工将进入企业,具身智能在拣选等场景规模化部署。...
AI技术新进展:多模态助手和智能体成趋势
今年,AI技术在大语言模型和多模态方面取得新进展,多家科技公司推出新模型,实现重大突破。AI正逐步从通用大模型向多模态助手和智能体演进,加快科学进展,开创新发现和成就新时代。...



