Mooncake项目荣获FAST 2025最佳论文奖,展现技术革新
Kimi与清华大学合作的Mooncake项目技术报告在FAST 2025上获得最佳论文奖。Mooncake作为底层推理服务平台,以其KVCache为中心的全局缓存和调度器,致力于在严格的延迟目标下最大化吞吐量,展现了强大的技术实力。...
Kimi与清华大学合作的Mooncake项目技术报告在FAST 2025上获得最佳论文奖。Mooncake作为底层推理服务平台,以其KVCache为中心的全局缓存和调度器,致力于在严格的延迟目标下最大化吞吐量,展现了强大的技术实力。...