阶跃星辰Step-1o系列模型新春上新:Step-1o Vision上线,Step-1o Audio升级
AI导读:
阶跃星辰公司春节前夕推出Step-1o系列模型新成员Step-1o Vision多模态理解大模型,并升级Step-1o Audio语音模型。两款模型均已全量开放,为用户提供更精准的视觉识别和更流畅的语音交互体验。

在推理模型Step R-mini发布之后,阶跃星辰公司在春节前夕再次发力,Step系列模型迎来“新春上新”高潮!
阶跃星辰最新研发的Step-1o系列模型,作为一款原生端到端文本、视觉、语音三模态生成理解一体化模型,再次展示了其强大的创新能力。就在一个月前,1o家族的首个成员Step-1o Audio震撼问世,成为国内首个千亿参数端到端语音大模型,引领了语音技术的新潮流。而今(1月21日),Step-1o系列再度传来喜讯:新成员Step-1o Vision多模态理解大模型正式上线,同时Step-1o Audio语音模型也迎来了能力升级。
Step-1o Vision作为Step-1o多模态系列模型中的视觉版本,相较于之前的Step-1V和Step-1.5V视觉理解模型,在架构上实现了全面升级。这一升级使得Step-1o Vision在视觉感知和识别、指令跟随、空间理解与推理等关键视觉任务上的表现有了显著提升,为用户带来了更加精准、高效的视觉体验。

据新民晚报记者亲身体验,Step-1o Vision展现出了惊人的图像识别能力。无论是自然场景、物体细节还是复杂图表,它都能精准识别,甚至在图像质量不佳、存在遮挡或变形等极端情况下,依然能保持高准确率。这一能力无疑将为用户在图像处理、分析等方面提供极大便利。
更令人惊叹的是,Step-1o Vision还是一款具备高智商的多模态模型。它不仅能根据图片内容进行复杂推理,还能为用户提供解题策略和创作灵感。这种智能化的处理能力,无疑将为用户在创作、学习等方面带来更多可能性。

与此同时,全面升级后的Step-1o Audio也展现出了更加出色的表现。它在情绪感知、理解能力以及个性化风格表达上都有了显著提升,声音更加自然流畅。此外,它还支持多语种及方言理解,实现了更低的时延,为用户带来了更加流畅、自然的语音交互体验。
目前,这两款模型均已全面开放。用户只需登录跃问App即可使用Step-1o Audio和Step-1o Vision,同时Step-1o Vision也支持在跃问网页端调用。这一举措无疑将为用户在文本、视觉、语音等多模态交互方面提供更多便利和选择。
(文章来源:上观新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

