优秀财经网 优秀的人都在用的资讯工具

全球指数

首页 > TAG信息列表 > 强化学习
  • 人形机器人创新中心发布“格物”仿真平台,加速产业化

    国家地方共建人形机器人创新中心联合上海大学、清华大学发布具身智能仿真平台“格物”,该平台集成了强化学习框架与多模态运动控制技术,一套代码覆盖百余款机器人,推动人形机器人技术从实验室迈向产业化。...

    2025-03-21
  • 人形机器人连续后空翻技能突破,强化学习助力动作技能提升

    人形机器人连续后空翻技能突破,强化学习助力动作技能提升

    北京一家机器人研发团队成功展示了能够连续后空翻的人形机器人,通过强化学习和硬件创新,仅用三周时间就让机器人掌握了这一高难度动作,展现了人工智能在动作技能方面的巨大潜力。...

    2025-03-15
  • 人形机器人技术突破与规模化落地加速

    人形机器人领域近期火热,多个品牌展示新技能。清华大学教授指出强化学习技术取得突破。创新中心提出解决方案,上线通用机器人平台。2025年被视为人形机器人商业场景落地元年,面临规模化量产考验。政府工作报告支持大模型广泛应用,智能机器人成为未来产业。...

    2025-03-15
  • 灵犀X2:全新人形机器人引领未来家庭服务

    智元机器人创始人彭志辉发布全新机器人灵犀X2,具备高自由度运动能力、情感交互能力和通用任务执行能力。其运动能力源自强化学习,交互反应毫秒级,有望成为家庭的保安、保姆、保洁。灵犀X2的发布让人们看到了人形机器人进入家庭的曙光。...

    2025-03-11
  • 2024年图灵奖揭晓:强化学习领域两位巨擘获奖

    3月5日,ACM宣布将2024年图灵奖授予安德鲁·巴托和理查德·萨顿,表彰他们在强化学习领域的奠基性贡献。两位科学家的工作推动了强化学习和深度强化学习的理论发展,在游戏AI等领域产生深远影响。同时,他们也表达了对当前人工智能开发中安全隐患的担忧。...

    2025-03-06
  • 阿里Qwen团队发布QwQ-32B大语言模型,强化学习实现性能跨越

    阿里Qwen团队发布QwQ-32B大语言模型,该模型在参数量仅为DeepSeek-R1约1/21的情况下,通过强化学习实现性能跨越。这一成果展示了阿里在AI领域的实力,为AI应用发展开辟新可能。...

    2025-03-06
  • 菜鸟研发自动驾驶强化学习规划器,引领物流科技新突破

    菜鸟研发出业内首个自动驾驶高性能大规模强化学习规划器,被CVPR 2025收录。该规划器将提升菜鸟无人车应对复杂场景的能力,标志着菜鸟在自动驾驶技术领域的重大突破。同时,菜鸟无人车技术团队与南洋理工大学联合研发的自动驾驶系统也在全球知名平台登顶。...

    2025-03-05
  • 月之暗面Kimi发布MoBA技术,与DeepSeek在注意力机制上‘碰撞’

    月之暗面Kimi发布MoBA技术,在长文本处理中大幅降低计算时间和内存消耗。同期,DeepSeek提出原生稀疏注意力机制,两家公司在注意力机制研究上发生‘碰撞’,有助于推动强化学习技术的发展。...

    2025-02-19
  • 中信证券:AI推动金融投研进入智能化新阶段

    中信证券研报显示,DeepSeek架构证实LLM推理能力可通过强化学习获取,推动AI在金融投研领域突破数据处理,赋能信息分析与策略构建,开启全流程智能化新阶段。...

    2025-02-11
  • 中信证券:DeepSeek新一代模型引领AI产业链新变革

    中信证券研报指出,DeepSeek新一代模型发布,以其强能力与低成本特点著称,对全球AI产业链带来借鉴意义。模型强调强化学习技术路线,推理能力强、性价比突出,有望开启全新Scaling Law,加速AI应用全面落地。...

    2025-02-05
  • DeepSeek-R1引领AI大模型新竞争态势

    DeepSeek公司发布最新开源模型DeepSeek-R1,引发国内外广泛关注。百度智能云、腾讯云等平台纷纷上线该模型,标志着AI大模型竞争新动向。DeepSeek-R1通过强化学习等技术实现突破,有望激发创新浪潮,推动全球AI技术持续进步。...

    2025-02-05
  • Deepseek发布深度推理模型R1-Zero,算力需求低却性能卓越

    中信建投研报指出,Deepseek发布的R1-Zero模型采用纯粹强化学习训练,实现了与OpenAI模型相媲美甚至超越的成绩,且算力需求较低。未来,人工智能模型的算力需求仍将爆发式增长。...

    2025-02-04
  • Deepseek发布深度推理模型,强化学习展现强大推理力

    中信建投研报揭示,Deepseek公司发布的R1-Zero模型采用强化学习训练,取得卓越推理能力,与OpenAI模型相媲美。DeepSeek R1通过算法、框架和硬件优化协同降低算力需求,但未来算力需求仍将爆发式增长。...

    2025-02-04
  • DeepSeek崛起:杭州青年团队以低成本挑战硅谷AI巨头

    杭州一群平均年龄不足26岁的青年团队推出的DeepSeek应用,以低成本高效能挑战硅谷AI巨头,上架不足半个月便力压ChatGPT登顶苹果应用商店排行榜。其独特的强化学习训练模式和开源性质,为AI领域带来了新的发展机遇。...

    2025-01-27
  • DeepSeek热度飙升,成市场焦点

    DeepSeek应用近期热度飙升,登顶苹果应用商店免费APP下载排行榜,其开发者为杭州深度求索人工智能基础技术研究有限公司。DeepSeek-R1大模型发布后受到业界高度评价,具有强大推理能力和高性价比API定价,市场关注度高。...

    2025-01-27