DeepSeek发布新论文:直指大语言模型记忆力“短板”
DeepSeek发布新论文,提出“条件记忆”概念,旨在解决大语言模型存在的记忆力“短板”问题。论文提出名为Engram的模块,将语言建模任务分为静态模式检索与动态组合推理两大分支。该论文或为DeepSeek下一代模型的发布方向提供了线索。...
AI大模型的幻觉与规则边界
本文探讨了AI大模型的幻觉问题以及新生事物发展过程中面临的规则边界挑战。文中提到AI大模型的幻觉难以避免且引发了一系列争议和挑战。同时文章还介绍了国内外对于生成式内容的管理和法规指引。...
智元机器人发布首个大语言模型驱动的开源仿真平台
智元机器人在CES2026正式发布首个大语言模型驱动的开源仿真平台GenieSim3.0,基于NVIDIA Isaac Sim构建,可实现数字孪生级高保真环境。...
陪伴机器人:从概念探索到商业竞争
随着技术的不断进步和市场的逐渐成熟,陪伴机器人领域正在从概念探索期进入真正的商业竞争阶段。各大厂商在产品设计和功能实现上不断推陈出新。然而在这个赛道中稳定性、可持续性才是决定产品命运的关键变量。...
MiniMax港股IPO申购收官 吸引众多基石投资者
MiniMax(0100.HK)港股IPO申购正式收官,孖展金额超2533亿港元。作为大模型公司,MiniMax拥有超过2.12亿名个人用户,2025年前九个月营收同比增长超过170%。沙利文报告预计,中国大语言模型市场规模将大幅增长。...
中国人工智能崛起:开源大语言模型的全球影响
美国斯坦福大学发布报告指出,中国的人工智能(AI)模型在能力与采用率方面已接近甚至部分领先于国际先进水平。凭借开源、低成本等优势,中国AI模型的成本效益正在重塑全球商业决策。同时,中国模型的广泛采用可能重塑全球技术获取和依赖模式。...
加拿大研发新训练方法提升AI效率
加拿大滑铁卢大学研发出SubTrack++训练方法,可大幅缩短大语言模型的预训练时间并提升准确性。该技术有望降低AI工具的成本与环境负担,让更多人用上强大、便捷的AI技术。...
医渡科技中期业绩稳健增长,YiduCore持续研发医疗垂直领域大语言模型
医渡科技公布中期业绩,收入增长8.7%,其中大数据平台和健康管理平台收入均有显著增长。YiduCore持续推进医疗垂直领域大语言模型的研发与训练,基于超5000亿Token语料进行训练,处理分析了超13亿患者人次的医疗记录。...
斯坦福研究揭示LLM在识别用户错误信念方面的局限
美国斯坦福大学研究指出,大语言模型(LLM)在识别用户错误信念方面存在局限,无法可靠区分信念与事实,在高风险领域应用需审慎,否则可能支持错误决策、加剧虚假信息传播。...
人工智能大语言模型识别用户错误信念能力受限,财经应用需谨慎
最新研究指出,人工智能大语言模型可能无法可靠识别用户错误信念,尤其在医学、法律和科学等高风险领域需谨慎使用。研究分析了24种大语言模型,发现较新模型在识别虚假信念方面仍存在不足,这对财经信息的准确传播和投资者的决策提出了挑战。...
2025微博V影响力大会:视频改革与流量机制新动向
10月18日,2025微博V影响力大会在北京举行。微博围绕视频消费等板块改革,分发政策由播放量转为观看时长主导,加大对中长视频激励。会上还介绍了平台流量分发机制,引入大语言模型提升内容理解和用户体验,社交推荐尤为重要。...
恒生电子刘曙峰:大模型算力平台将重塑金融格局
10月18日,恒生电子联合创始人刘曙峰在全球财富管理论坛上表示,大模型算力平台将成为新一代操作系统,重塑金融格局。目前大模型在金融领域应用不足5%,但另类投资数字化已贡献超50%利润,金融机构数字化呈现平台一体化、全面云化、全面数据化三大趋势。...


