阶跃星辰Step-1o系列模型新春上新：Step-1o Vision上线，Step-1o Audio升级

商业视界 2025-01-22 04:06:16 来源：上观新闻作者：网络

AI导读：

阶跃星辰公司春节前夕推出Step-1o系列模型新成员Step-1o Vision多模态理解大模型，并升级Step-1o Audio语音模型。两款模型均已全量开放，为用户提供更精准的视觉识别和更流畅的语音交互体验。

　　在推理模型Step R-mini发布之后，阶跃星辰公司在春节前夕再次发力，Step系列模型迎来“新春上新”高潮！

　　阶跃星辰最新研发的Step-1o系列模型，作为一款原生端到端文本、视觉、语音三模态生成理解一体化模型，再次展示了其强大的创新能力。就在一个月前，1o家族的首个成员Step-1o Audio震撼问世，成为国内首个千亿参数端到端语音大模型，引领了语音技术的新潮流。而今（1月21日），Step-1o系列再度传来喜讯：新成员Step-1o Vision多模态理解大模型正式上线，同时Step-1o Audio语音模型也迎来了能力升级。

　　Step-1o Vision作为Step-1o多模态系列模型中的视觉版本，相较于之前的Step-1V和Step-1.5V视觉理解模型，在架构上实现了全面升级。这一升级使得Step-1o Vision在视觉感知和识别、指令跟随、空间理解与推理等关键视觉任务上的表现有了显著提升，为用户带来了更加精准、高效的视觉体验。

　　据新民晚报记者亲身体验，Step-1o Vision展现出了惊人的图像识别能力。无论是自然场景、物体细节还是复杂图表，它都能精准识别，甚至在图像质量不佳、存在遮挡或变形等极端情况下，依然能保持高准确率。这一能力无疑将为用户在图像处理、分析等方面提供极大便利。

　　更令人惊叹的是，Step-1o Vision还是一款具备高智商的多模态模型。它不仅能根据图片内容进行复杂推理，还能为用户提供解题策略和创作灵感。这种智能化的处理能力，无疑将为用户在创作、学习等方面带来更多可能性。

　　与此同时，全面升级后的Step-1o Audio也展现出了更加出色的表现。它在情绪感知、理解能力以及个性化风格表达上都有了显著提升，声音更加自然流畅。此外，它还支持多语种及方言理解，实现了更低的时延，为用户带来了更加流畅、自然的语音交互体验。

　　目前，这两款模型均已全面开放。用户只需登录跃问App即可使用Step-1o Audio和Step-1o Vision，同时Step-1o Vision也支持在跃问网页端调用。这一举措无疑将为用户在文本、视觉、语音等多模态交互方面提供更多便利和选择。

（文章来源：上观新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。