AI导读:

国家超算互联网平台近日上线“沪牌”大模型MiniMax,包括基础语言大模型和视觉多模态大模型,实现高效长文本处理能力。MiniMax发布新一代系列模型,上下文长度达顶尖模型20—32倍,引发广泛关注。双方将携手推动国产大模型技术加速发展。

近日,国家超算互联网平台正式上线“沪牌”大模型MiniMax,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01,现已入驻超算互联网AI开源社区。同时,超算互联网ChatBot对话服务也已接入,为用户提供智能、自然的AI对话体验。

MiniMax作为国产大模型的佼佼者,专注于多模态通用大模型的研发与应用,核心技术覆盖文本、语音、图像及视频领域。此次入驻的MiniMax-Text-01与VL-01,通过创新算法优化,实现了更高效的长文本处理能力,进一步突破技术边界。

MiniMax发布的新一代系列模型MiniMax-01,首次将线性注意力机制扩展到商用模型级别,上下文长度达到顶尖模型的20—32倍水平,推理时的上下文窗口能达到400万token,引发海内外广泛关注。

谷科技媒体VentureBeat及众多AI科技学者、投资人与创作者高度评价MiniMax-01系列模型的架构创新及长文本能力。

当前,大多数AI模型在处理长文本、多模态信息时存在困难。而MiniMax-01的上下文窗口能达到400万token,约等于700万字的上下文处理能力,相当于秒速读完四大名著和哈利波特全集。

在架构上,MiniMax-Text-01重构了训练和推理系统,参数量高达4560亿,每次激活459亿。创新的线性注意力机制,使模型在处理长输入时保持优异效果,同时实现低延迟。

MiniMax还开发了多模态版本MiniMax-VL-01,整合图像编码器和适配器,将图像转化为大语言模型能理解的token形式,具备强大的视觉理解能力。

随着智能体进入应用场景,长上下文能力与多模态处理能力的提升,将为AI智能体在各行业带来更丰富的解决方案。国家超算互联网平台作为国家级算力服务平台,通过链接算力产业上下游资源,加速AI生态全面发展。

MiniMax入驻国家超算互联网平台,将携手推动国产大模型技术加速发展,促进更多应用开发者开展有价值、突破性的研究。

(文章来源:上观新闻)