国家超算互联网平台上线超长文本多模态大模型
AI导读:
国家超算互联网平台近日上线超长文本多模态大模型,由稀宇科技研发。该模型将激发更多关于长上下文技术的创新研究与实际应用,推动智能体为各行业提供更丰富、高效的解决方案。同时,国家超算互联网平台正积极推动AI生态建设。
随着智能体(Agent)应用场景的不断拓展,对大模型的上下文窗口长度提出了更高要求,无论是单个智能体工作时的记忆,还是多智能体协作产生的上下文信息。澎湃科技4月15日报道,国家超算互联网平台近日正式上线了由上海稀宇科技有限公司(以下简称“稀宇科技”)研发的超长文本多模态大模型,分别为MiniMax-Text-01和MiniMax-VL-01。
SCNet超算互联网平台chat页面截图来源:MiniMax供图
国家超算互联网作为国家级算力服务平台,自2024年4月正式上线以来,积极推动AI生态建设。今年2月,该平台启动了“AI生态伙伴加速计划”,提供多项激励措施,加速生态伙伴的全面发展。
据统计,自上线一年来,国家超算互联网平台总用户量已突破35万,连接了全国14个省区市的20多家超算和智算中心,上线算力商品超过6500款,其中AI模型服务有近240款,涵盖了国内外多个开源模型。
稀宇科技表示,此次与国家超算互联网平台的合作将激发更多关于长上下文技术的创新研究与实际应用,推动智能体为各行业提供更丰富、高效的解决方案。
“当前,国内外的大模型虽然‘大脑’庞大,但‘记忆力’往往受限。”稀宇科技研发负责人指出,“面对长达1000页的法律合同、长篇小说或几十万行的源代码项目,大多数大模型难以完成准确摘要、风险发现及结构化建议等任务。而MiniMax-01凭借其约700万字的上下文窗口,能够轻松应对这些挑战,相当于同时阅读完中国四大文学名著和哈利波特全集。”
据悉,新一代MiniMax-01系列模型在“上下文长度”指标上达到了国内外顶尖水平的20—32倍,推理时的上下文窗口能达到400万token(词元)。MiniMax-Text-01模型参数量高达4560亿,每次激活459亿,其创新的注意力机制确保了处理长输入时的效果与低延迟。
加入国家超算互联网后,MiniMax将充分利用平台资源,推动长上下文技术的创新与应用,加速国产人工智能技术的发展。稀宇科技表示,未来将继续以开源形式发布新版旗舰模型,并与国家超算互联网展开深入合作。
(文章来源:澎湃新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

