AI导读:

趋境科技与华为联合发布“鲲鹏+xPU 解决方案”,深度融合异构协同推理技术与鲲鹏基础软硬件平台,提供多种产品形态,显著降低大模型推理门槛,推动AI普惠化。

2025年5月22日,在鲲鹏昇腾开发者大会2025(KADC 2025)上,趋境科技CEO艾智远与华为鲲鹏计算业务总裁李义联合发布了“鲲鹏+xPU 解决方案”,该方案深度融合了趋境科技领先的异构协同推理技术与鲲鹏基础软硬件平台,专为大模型推理场景打造。

该方案广泛兼容昇腾等主流xPU,覆盖从数据中心到边缘的各种场景,提供鲲鹏推理工作站、鲲鹏推理服务器等多种产品形态,适配Deepseek、Qwen等主流大模型。通过搭载趋境科技的异构推理优化技术,显著降低了大模型推理的门槛,助力企业构建高性能、低门槛的智能算力基础设施。

趋境科技在大会分论坛上还分享了基于“鲲鹏+xPU解决方案”中的具体技术实现与性能指标,展现了其在AI技术领域的深厚实力。

技术架构:异构协同突破推理性能极限

在“鲲鹏+xPU 解决方案”中,趋境科技运用了业界首创的异构协同推理技术,并与鲲鹏技术软硬件进行了深度适配:

1、NUMA亲和优化。针对NUMA众多的问题,对算子进行NUMA亲和改造,以减少跨NUMA的访问和同步,降低访问延迟,提升推理吞吐。

2、鲲鹏计算加速。利用KML鲲鹏数学库进行加速,算子性能提升100%;通过鲲鹏工具链中的毕昇编译器编译,性能再提升50%。

3、并行计算加速。开启MTP(多tokens/s预测),性能提升约40%;采用新技术“Expert延迟计算”,完全隐藏NPU CPU运行空泡,性能最高可提升2倍。

基于趋境科技与清华大学KVCache.AI团队开源的异构推理框架KTransformers,已完成两种方案的性能调试,展现出卓越的性能。

趋境科技计划在鲲鹏昇腾种子计划的加持下,与鲲鹏进一步深化合作,推出更多产品形态,将大模型拓展到端侧,推动AI技术的普惠化。

趋境科技秉持“生态共赢”的理念,通过部分开源技术推进技术社区建设和技术普惠,其异构推理框架KTransformers已吸引全球超万名开发者关注。同时,与各生态合作伙伴合作,推出多样化的推理解决方案,致力于解决大模型落地的实际问题,推动企业真正低门槛应用大模型。

(文章来源:界面新闻)