智谱首次发布推理基础设施技术报告 揭秘大模型后台“隐形BUG”
4月30日凌晨,智谱发布技术博客,公布GLM-5底层基础设施重大工程进展:系统吞吐最高提升132%,相同硬件条件下服务能力显著扩容。HiCache修复方案已通过Pull Request #22811提交至SGLang开源社区。
同时,智谱推理优...
4月30日凌晨,智谱发布技术博客,公布GLM-5底层基础设施重大工程进展:系统吞吐最高提升132%,相同硬件条件下服务能力显著扩容。HiCache修复方案已通过Pull Request #22811提交至SGLang开源社区。
同时,智谱推理优...