首页
学习
活动
专区
圈层
工具
发布

智谱发布Infra新成果,同等硬件投入下算力多出15%

5月21日消息,智谱今日宣布落地部署了一项直接影响大模型推理效率的架构创新ZCube:在线上GLM-5.1 coding场景中,在保持GPU算力、软件栈与应用不变的前提下,ZCube节省了33%交换机与光模块成本,同时将GPU平均推理吞吐提升了15%,并将TTFT P99降低了40.6%。

这意味着,同样的硬件投入下,智谱GLM大模型现在每秒能多响应15%的API请求。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OQZnKRkjj4Et9Cp6xaYmP0Xg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券