开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >专栏 >理解 KV Cache：LLM 推理为什么能越写越快

理解 KV Cache：LLM 推理为什么能越写越快

作者头像

七牛开发者

修改于 2026-05-23 13:53:44

修改于 2026-05-23 13:53:44

1660

举报

概述

只要你和现在的 AI 工具交流，无论是 Codex、Claude，还是 ChatGPT、DeepSeek、豆包，你应该都注意过一件事：它并不是一次性把完整答案吐出来，而是一个字接着一个字，慢慢形成一行字，再逐渐生成一整段话，直到所有结果都返回完毕。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

评论

登录后参与评论

0 条评论

热度

最新