AI导读:

阶跃星辰公司春节前夕推出Step-1o系列模型新成员Step-1o Vision多模态理解大模型,并升级Step-1o Audio语音模型。两款模型均已全量开放,为用户提供更精准的视觉识别和更流畅的语音交互体验。

  在推理模型Step R-mini发布之后,阶跃星辰公司在春节前夕再次发力,Step系列模型迎来“新春上新”高潮!

  阶跃星辰最新研发的Step-1o系列模型,作为一款原生端到端文本、视觉、语音三模态生成理解一体化模型,再次展示了其强大的创新能力。就在一个月前,1o家族的首个成员Step-1o Audio震撼问世,成为国内首个千亿参数端到端语音大模型,引领了语音技术的新潮流。而今(1月21日),Step-1o系列再度传来喜讯:新成员Step-1o Vision多模态理解大模型正式上线,同时Step-1o Audio语音模型也迎来了能力升级。

  Step-1o Vision作为Step-1o多模态系列模型中的视觉版本,相较于之前的Step-1V和Step-1.5V视觉理解模型,在架构上实现了全面升级。这一升级使得Step-1o Vision在视觉感知和识别、指令跟随、空间理解与推理等关键视觉任务上的表现有了显著提升,为用户带来了更加精准、高效的视觉体验。

  据新民晚报记者亲身体验,Step-1o Vision展现出了惊人的图像识别能力。无论是自然场景、物体细节还是复杂图表,它都能精准识别,甚至在图像质量不佳、存在遮挡或变形等极端情况下,依然能保持高准确率。这一能力无疑将为用户在图像处理、分析等方面提供极大便利。

  更令人惊叹的是,Step-1o Vision还是一款具备高智商的多模态模型。它不仅能根据图片内容进行复杂推理,还能为用户提供解题策略和创作灵感。这种智能化的处理能力,无疑将为用户在创作、学习等方面带来更多可能性。

  与此同时,全面升级后的Step-1o Audio也展现出了更加出色的表现。它在情绪感知、理解能力以及个性化风格表达上都有了显著提升,声音更加自然流畅。此外,它还支持多语种及方言理解,实现了更低的时延,为用户带来了更加流畅、自然的语音交互体验。

  目前,这两款模型均已全面开放。用户只需登录跃问App即可使用Step-1o Audio和Step-1o Vision,同时Step-1o Vision也支持在跃问网页端调用。这一举措无疑将为用户在文本、视觉、语音等多模态交互方面提供更多便利和选择。

(文章来源:上观新闻)