美团LongCat团队发布LongCat-Flash-Thinking高效推理模型
9月22日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking,具备深度思考与工具调用能力,已在HuggingFace、Github全面开源。...
阿联酋与G42推低成本AI推理模型K2 Think,性能超越大规模模型
当地时间9月9日,阿联酋MBZUAI大学与G42推出低成本AI推理模型K2 Think,仅需320亿参数即超越规模大20倍的模型,基于阿里巴巴Qwen 2.5构建,展现强大性能。...
AI虚假信息泛滥:幻觉问题成焦点
2025年,AI已成为普及工具,但虚假信息问题凸显。DeepSeek发布R2模型谣言等事件频发,大模型幻觉问题成为焦点。成因复杂,虽可通过技术手段缓解,但难以根除。抗击虚假信息需多方合力。...
OpenAI推理模型IMO竞赛获金牌 数学家呼吁审慎看待
OpenAI宣布其推理模型在国际数学奥林匹克竞赛中获金牌,六道题答对五道。员工称在通用强化学习上有新突破,但数学家陶哲轩呼吁审慎看待,因测试细节改变或影响成绩。...
Meta聘请OpenAI研究员 加速人工智能推理模型研发
Meta已聘请OpenAI研究员Trapit Bansal,负责其人工智能推理模型的研发,此举将加速Meta在人工智能领域的技术突破与创新。...
MiniMax发布M1模型,AI推理领域迎新突破
MiniMax发布了自主研发的M1系列模型,被誉为全球首个开源的大规模混合架构推理模型。M1在处理超长文本上实现突破,定价低于竞品,且推出超长文本档位。其独创的混合架构和CISPO算法显著提升计算效率和强化学习稳定性。...
法国Mistral公司推出新推理模型,挑战OpenAI与DeepSeek
法国人工智能初创公司Mistral推出首个推理模型,声称能与OpenAI、DeepSeek等产品抗衡,支持多语言推理,展现了卓越的数学和编程能力,成为AI竞争的新焦点。...
DeepSeek R1模型低调升级,AI领域热议新突破
DeepSeek R1模型完成小版本试升级,引发科技圈热议。网友测评显示升级效果显著,思考时间延长,性能提升。同时,英伟达发布财报,营收大涨,CEO提及DeepSeek引发的推理模型关注及算力需求。...
OpenAI发布全新人工智能推理模型o3与o4-mini
美东时间4月16日,OpenAI发布了最新的人工智能推理模型o3和o4-mini,两款模型强化了ChatGPT工具能力,并在多维度分析、视觉任务等方面表现卓越。ChatGPT Plus、Pro和Team客户均可体验。...
DeepSeek V3模型升级,大模型发展迎来新突破
DeepSeek V3模型完成小版本升级,提升推理类任务表现,数学、代码评测得分超越GPT-4.5。未来大模型发展将呈现多维度、跨领域融合与突破,应用场景深化,技术融合与性能突破成为核心动力。...
OpenAI发布开放权重模型,AI开发者生态或将迎新机遇
华泰证券指出,OpenAI计划发布首个具备推理能力的开放权重语言模型,标志着技术策略转变,将降低使用成本,推动AI应用端繁荣,提升数据安全与自主性,AI应用或将迎来加速迭代。...
腾讯推出自研深度思考模型混元T1,AI技术再突破
3月21日,腾讯混元宣布推出自研深度思考模型混元T1正式版,在多项benchmark上取得优异成绩。此前,腾讯混元大模型已登上Chatbot Arena榜单全球Top 15。腾讯发布的新一代大模型混元Turbo实现推理效率大幅提升,成本降低50%。...
英伟达GTC大会:黄仁勋宣布AI芯片新进展,强调推理模型机遇
英伟达CEO黄仁勋在GTC大会上宣布了基于Blackwell架构的最新芯片和下一代Rubin架构将如期推出,并强调推理模型为芯片行业带来的新机遇。同时,英伟达还将推出端到端自动驾驶汽车全栈综合安全系统等新产品。尽管内容丰富,但英伟达股价仍下跌。...
科技大厂加速自研推理模型,DeepSeek错峰定价引关注
近期,多家科技大厂在接入DeepSeek的同时,加速自研旗下推理模型。腾讯AI助手“腾讯元宝”上线快思考模型混元Turbo S,实现“秒回”。同时,新一轮大模型在API调用价格上大幅下降,DeepSeek实行错峰优惠策略,引发业内关注。...
AI技术新突破:低成本推理模型引发期货市场关注
斯坦福大学等机构开发出低成本推理模型,性能媲美高性能模型,AI普惠性有望增强。期货市场密切关注AI进展,探索其在风险管理等方面的应用。测试时扩展技术为AI研发提供新路径。...


