AI导读:

近日,国家超算互联网平台宣布上线MiniMax国产AI大模型,MiniMax-Text-01和VL-01入驻超算互联网AI开源社区。MiniMax发布新一代模型,实现技术突破,提升长文本处理能力。双方将共同推动国产大模型发展,助力应用开发者开展有价值、突破性的研究。

  上证报中国证券网讯(记者孙小程)近日,国家超算互联网平台宣布上线MiniMax国产AI大模型,基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01正式入驻超算互联网AI开源社区。同时,超算互联网ChatBot对话服务也已接入,为用户提供智能、自然的AI对话体验。

  MiniMax专注于多模态通用大模型的研发与应用,核心技术覆盖文本、语音、图像及视频领域,自研模型架构在长文本处理、多模态融合等方面表现突出。此次入驻的MiniMax-Text-01与VL-01在技术上实现新突破,通过算法优化,大幅提升了长文本处理能力。

  今年年初,MiniMax发布并开源新一代模型MiniMax-01,首次将线性注意力机制应用于商用模型,综合实力跻身全球前列。其上下文长度达到顶尖水平的20-32倍,推理时上下文窗口可达400万token,约700万字,相当于秒速阅读四大名著和哈利波特全集。

  随着上下文窗口的扩展,MiniMax-Text-01的推理延迟增长缓慢。在架构层面,MiniMax的Text-01重构了训练和推理系统,参数量高达4560亿,每次激活459亿。MiniMax-01创新性地引入了线性注意力机制,80层注意力层中每层softmax attention前设置7层线性注意力层。得益于架构创新,模型在处理长输入时保持高效,延迟低。

  作为国家级算力服务平台,超算互联网于今年2月启动“AI生态伙伴加速计划”,旨在通过技术、资源和市场支持,促进创新链与产业链的深度融合。MiniMax入驻国家超算平台,双方将共同推动国产大模型发展,助力应用开发者开展有价值、突破性的研究。

  MiniMax表示,此次合作有望激发更多长上下文研究和应用,加速Agent时代的到来。开源也将推动MiniMax持续创新,提升后续模型研发质量。

  未来,MiniMax将持续开源新版旗舰模型,双方将进一步深化合作,探索更多合作机会。

(文章来源:上海证券报·中国证券网)