缓存 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签缓存

#缓存

缓存就是数据交换的缓冲区（称作Cache），当某一硬件要读取数据时，会首先从缓存中查找需要的数据，如果找到了则直接执行，找不到的话则从内存中找。缓存的作用是帮助硬件更快地运行。

2.8万亿参数的 Kimi K3，到底堆了什么？

乐小野

石化盈科信息技术有限责任公司｜算法工程师 (已认证)

2小时前2026-07-23 13:12:15

2.8 万亿这个数字，这两天在 AI 圈被反复引用。月之暗面在 7 月 17 日放出 Kimi K3 的同时，直接把它标成全球首个开放 3T-class 模型。...

200

Win电脑C盘清理全攻略：从入门到精通的深度优化技巧

目的地-Destination 2小时前2026-07-23 12:19:47

修改“Desktop”“My Documents”等键值为新路径 3. 重启生效（需管理员权限）

800

别再裸用workbuddy了，我把八类专家，拉成了一条生产线

瑭宋元 1天前2026-07-21 15:53:00

效率侧佐证：平台侧统计本月累计调用 8 亿+ tokens，缓存命中率 93.9%。长上下文复用把单位成本压到极低——用得越狠，边际越便宜。

9311

ollama v0.32.1发布详解：工具调用更稳、多轮推理更强、内存泄漏修复、模型加载超时生效与交互体验全面升级

福大大架构师每日一题 2天前2026-07-21 13:30:12

缓存快照性能的优化，虽然在版本说明里只有短短一句，但它依然值得单独关注。因为缓存快照通常与状态记录、复用效率、运行过程中的资源管理紧密相关。只要性能更好，就意味...

6510

大部分token根本不该重复计算，不止于KVCache

用户11563501 2天前2026-07-21 09:34:39

前缀缓存要求缓存内容必须是新请求一字不差的前缀。改一个字符，整个缓存全废。实际生产里，三种常见场景直接让缓存失效：

8710

从 200K 到 1M：长上下文管理的原理

柏拉图的美工刀 2天前2026-07-21 08:08:08

最近我们团队做了一个销售AI助手，以问答为主，慢慢加上了识别文档功能。最开始的需求很小：识别一张图片——销售在客户现场拍一张资料或名片的截图，模型提取关键信息。...

6310

工具站还在每次请求打回源站？先别急着上Edge · Day 62

袁锐钦 2天前2026-07-20 21:57:09

✅ Cloudflare Workers、Vercel Edge / Middleware 一类能力，是 2026 年主流托管平台都在推的边缘运行时。 ⚠ 下文...

6810

ARP协议工作原理与ARP欺骗防御技术详解

程序员古德 2天前2026-07-20 21:01:59

ARP全称Address Resolution Protocol，中文译为地址解析协议。它工作在OSI模型的数据链路层与网络层之间。RFC 826对ARP的定义...

8300

一行代码引发的线上事故，复盘Python生产环境那些隐患

用户11081884 2天前2026-07-20 20:36:19

Python里falsy值可不止 None——0、""、[]、False，统统被 or 当作“没取到”。而这些都是完全合法的缓存值。用户余额为0？缓存击穿。查询...

9110

Python 装饰器10种高级用法，用完后悔没早知道

用户11081884 2天前2026-07-20 20:16:33

使用场景：需要根据配置动态调整装饰行为的场景，如不同环境的日志级别、缓存时间等。

8600

Python @property装饰器10种高级用法，让你的代码更优雅高效！

用户11081884 2天前2026-07-20 20:16:23

场景：当某个属性的值需要基于其他属性计算得出，且计算成本较高时，可以使用@property结合缓存机制。

6100

实战DNS：从理论到线上应用，收藏

用户11081884 2天前2026-07-20 19:42:27

DNS（Domain Name System）是因特网上作为域名和IP地址相互映射的一个分布式数据库。通过主机名获取对应的IP地址的过程称为域名解析。DNS协议...

8110

Docker 容器镜像分析与优化方法

用户11081884 2天前2026-07-20 18:37:55

Docker 已成为应用打包和部署的标准工具。随着应用复杂度的增加Docker 镜像往往会变得臃肿不堪，这不仅影响构建和部署效率，还会增加存储成本和安全隐患。本...

5810

Python 15个高效代码写法：提升开发效率

用户11081884 2天前2026-07-20 18:02:47

Python以其简洁优雅的语法和强大的功能深受开发者喜爱。本文将介绍15个高效的Python代码写法，不仅能提升代码的可读性和性能，还能让开发效率提升。本文所有...

10810

Kubernetes Pod分配和调度策略

用户11081884 2天前2026-07-20 17:11:04

在Kubernetes中，调度器的核心功能是自动分配Pod到合适节点，但通过以下高级特性可精细化控制调度逻辑，满足复杂场景需求：

7610

改完内容Google还在看旧页面？工具站缺的不是内容，是ISR · Day 61

袁锐钦 5天前2026-07-17 20:21:24

ISR（Incremental Static Regeneration，增量静态再生）。

9610

混合检索RAG：多路召回+Reranker重排模型实战

陆业聪 6天前2026-07-17 10:43:39

• Android 17 曝出对应用内存做出更严格限制，后台驻留策略进一步收紧，长期挂后台的服务类应用要重新评估存活策略。

16410

大模型比价：选对不选贵，你的钱花对了吗？

用户12493922 6天前2026-07-17 03:58:33

11010

一个新 HTTP 方法 QUERY 上线了，它到底帮我们省了哪些事？

前端达人 6天前2026-07-16 19:47:55

安全上也还有新坑要填。QUERY 允许「带 body 的只读查询」还能被缓存，这就多了些新的攻击面，比如把带敏感条件的查询缓存进了共享 CDN、或者老中间件对这...

6910

系统架构设计师：Cache高速缓存三种映射方式一把讲透｜全相联直接组相联原理

程序员古德 7天前2026-07-16 14:02:43

Cache高速缓存是计算机存储体系的核心组件，位于CPU与主存之间，利用程序访问的局部性原理，以接近寄存器速度响应CPU的数据请求，同时以主存的容量承载海量数据...

10710

#缓存

2.8万亿参数的 Kimi K3，到底堆了什么？

Win电脑C盘清理全攻略：从入门到精通的深度优化技巧

别再裸用workbuddy了，我把八类专家，拉成了一条生产线

ollama v0.32.1发布详解：工具调用更稳、多轮推理更强、内存泄漏修复、模型加载超时生效与交互体验全面升级

大部分token根本不该重复计算，不止于KVCache

从 200K 到 1M：长上下文管理的原理

工具站还在每次请求打回源站？先别急着上Edge · Day 62

ARP协议工作原理与ARP欺骗防御技术详解

一行代码引发的线上事故，复盘Python生产环境那些隐患

Python 装饰器10种高级用法，用完后悔没早知道

Python @property装饰器10种高级用法，让你的代码更优雅高效！

实战DNS：从理论到线上应用，收藏

Docker 容器镜像分析与优化方法

Python 15个高效代码写法：提升开发效率

Kubernetes Pod分配和调度策略

改完内容Google还在看旧页面？工具站缺的不是内容，是ISR · Day 61

混合检索RAG：多路召回+Reranker重排模型实战

大模型比价：选对不选贵，你的钱花对了吗？

一个新 HTTP 方法 QUERY 上线了，它到底帮我们省了哪些事？

系统架构设计师：Cache高速缓存三种映射方式一把讲透｜全相联直接组相联原理

热门专栏

Technology Share

张戈的专栏

田飞雨的专栏

腾讯云中间件的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐