智谱携手清华成功落地ZCube网络架构,实现成本与性能双优化
2026-05-21 12:16:26未知 作者:徽声在线
每经AI快讯,5月21日消息,根据智谱官方公众号发布的信息,智谱携手驭驯网络以及清华大学团队,在GLM-5.1的线上生产集群环境中,成功实现了新一代网络架构ZCube的大规模应用部署。具体而言,在GLM-5.1的编码(coding)应用场景下,ZCube架构在维持GPU计算能力、软件系统栈以及上层应用不变的情况下,展现出了显著的性能提升与成本优化效果。具体数据方面,交换机与光模块的成本降低了33%,同时GPU的平均推理吞吐量实现了15%的增长,更为突出的是,TTFT P99(即99%请求的完成时间)指标大幅下降了40.6%,标志着系统整体响应速度与稳定性的显著提升。

