声网发布对话式AI新品,引领人工智能新趋势
2021年声网因马斯克Clubhouse语音聊天走红,近日声网年度服务分钟数突破1万亿分钟,并发布多款对话式AI新品。多模态大模型让计算机具备实时语音对话能力,声网将对话式AI作为长期战略投入,推出对话式AI引擎2.0等产品,AI语音助手等场景受关注。...
多模态文本智能技术:AI在财经科技领域的新突破
第八届中国模式识别与计算机视觉学术会议聚焦多模态文本智能技术,合合信息推出创新方案,实现从感知到认知再到决策的技术闭环,提升AI在财经领域的自主决策能力,助力金融、医药等行业智能化转型。...
多模态文本智能技术:引领AI新范式与产业革新
第八届中国模式识别与计算机视觉学术会议上,多模态文本智能技术成为焦点。合合信息推出的方案通过空间位置理解实现立体化综合理解,解决多模态AI应用难题。多模态AI技术将在未来五年成为提升应用功能的核心技术,方案已在多领域应用,推动AI系统进化为业务伙伴。...
上海AI实验室开源书生·万象3.5大模型,参数规模惊人
9月3日上海人工智能实验室宣布开源通用多模态大模型书生·万象3.5,其有9种尺寸模型,参数涵盖10亿 - 2410亿,为AI模型应用带来新可能。...
2025具身智能机器人十大发展趋势解析
2025世界机器人大会发布具身智能机器人十大发展趋势,涵盖物理实践与模拟、多层次决策、智能控制、生成式设计、软硬件一致性、大工厂研发、大规模数据集、集群协同、开源社区及安全评估等方面。...
2025世界人工智能大会:AI+教育医疗新探索
2025世界人工智能大会在上海启幕,聚焦AI+教育,探讨医疗AI进化阶段及多模态大模型发展,谢伟迪团队推出DeepRare System解决罕见病诊断难题。...
早期中华文明多模态大模型发布 开启智能化研究新路径
7月26日,全球首个聚焦早期中华文明的人工智能模型——多模态大模型发布。该模型整合多学科珍稀史料,形成超大数据规模知识体系,实现跨模态深度交互,未来将服务学者研究与公众文化普及。...
多模态大模型:技术路线未收敛,商业化需突破
2025智源大会上,智源研究院发布了原生多模态世界模型Emu3等“悟界”大模型系列。多模态大模型技术路线尚未收敛,视频生成能力处于GPT-2到GPT-3阶段,商业化应用面临挑战。预计到2025年,全球多模态大模型市场规模将达到1280亿美元。...
空间智能技术助力AI跨越“虚实鸿沟”
近年来,千亿参数级大模型取得突破,但面临“虚实鸿沟”挑战。上海码极客/成都考拉悠然创始人申恒涛表示,空间智能技术是实现AI从虚拟到现实落地的关键。联合同济大学发布悠然无界大模型及MAGX空间智能体产品家族,旨在打造全栈空间智能技术体系。...
字节跳动发布Seed1.5-VL多模态大模型,探索AI新机遇
字节跳动Seed团队发布视觉-语言多模态大模型Seed1.5-VL,具备卓越的多模态理解和推理能力,标志着AI技术的新飞跃。该模型在多个评测基准中取得SOTA表现,将进一步推动AI应用深入落地,建议关注AI主题投资机会。...
阶跃星辰加速多模态大模型开源,助力AI技术创新
阶跃星辰近日开源图像编辑大模型Step1X-Edit,今年以来已发布多个开源模型,为全球开源社区注入动力。公司重点布局多模态大模型,加速AI技术与产业创新融合,携手合作伙伴打造人工智能超级助手,助力构建开放协同的AI生态系统。...
2025生成式AI商业高峰论坛:AI Agent商业化落地路径探讨
2025年度生成式AI商业高峰论坛召开,多位AI领域创业者分享了对AI Agent商业化落地的看法。他们强调了垂直领域深耕、多模态大模型突破及解决业务痛点的重要性。...
多模态大模型“上新潮”,上市公司加速布局AI商业化
随着AI市场蓬勃发展,多模态大模型迎来“上新潮”,企业以多模态融合、推理效率提升及成本优化为突破口,加速AI技术商业化落地。多家上市公司积极探索将多模态大模型引入日常工作,助力提升生产力和应用效能。...
上海AI实验室开源多模态大模型InternVL3
上海人工智能实验室升级并开源了通用多模态大模型“书生·万象3.0(InternVL3)”,在开源模型中性能位列第一,并显著提升多项能力。该实验室致力于开展战略性、原创性、前瞻性的科学研究与技术攻关。...


