搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏大模型应用
大模型应用：本地大模型部署中的Token效率优化与性能分析.9
随着模型规模的不断扩大和应用场景的多样化，如何在不牺牲对话质量的前提下优化Token使用效率，已成为提升大模型应用经济性和实用性的关键问题。 token监控的维度：总量指标：累计Token消耗效率指标：平均每轮Token使用性能指标：生成速度和吞吐量质量指标：通过回复内容间接反映场景分类逻辑：短问答：简单事实性查询，预期简短回复技术解释：复杂概念阐述 AI技术不仅提高了工作效率和生活质量，也为解决复杂的社会问题提供了新的工具。优化策略层Prompt优化：精简指令，减少冗余Token长度控制：动态调整生成长度参数批处理优化：提高批量请求处理效率上下文压缩：智能管理长对话历史4. ，确保系统在不同硬件环境下的可用性通过持续的技术迭代和优化，我们相信Token效率优化将在推动大语言模型普惠应用方面发挥越来越重要的作用。
81943编辑于 2026-02-06
来自专栏python3
优化python执行效率
开始优化前，写一个高级测试来证明原来代码很慢。你可能需要采用一些最小值数据集来复现它足够慢。通常一两个显示运行时秒的程序就足够处理一些改进的地方了。有一些基础测试来保证你的优化没有改变原有代码的行为也是很必要的。你也能够在很多次运行测试来优化代码的时候稍微修改这些测试的基准。那么现在，我们来来看看优化工具把。内建优化器启用内建的优化器就像是用一门大炮。它非常强大，但是有点不太好用，使用和解释起来比较复杂。你也可以用如下的方法： 1．忍受缓慢或者缓存它们 2．重新思考整个实现 3．更多使用优化的数据结构 4．写一个C扩展注意了，优化代码是种罪恶的快感！先把它缓存起来再进行优化其实更好。
94520发布于 2020-01-13
来自专栏AI SPPECH
Token Runtime：成本控制与性能优化
目录 1 引言：为什么Token管理是AI IDE的生命线 2 Token计数：文本到Token的映射与优化 2.1 Tokenization的数学原理 2.2 主流模型的Token计数差异 2.3 Token 计数器的工程实现 2.4 Token计数的精确度优化 2.5 Token计数与成本模型 3 使用量追踪：多维度统计体系设计 3.1 追踪架构设计 3.2 追踪数据模型 4 预算控制：多层次成本约束机制 2 Token计数：文本到Token的映射与优化本节为你提供的核心技术价值：掌握主流模型的Token计数原理，理解不同编码方式的差异与优化策略 2.1 Tokenization的数学原理 Token是线程安全：支持高并发场景 9.3 未来演进方向智能化增强基于强化学习的自适应压缩策略更精准的任务复杂度预测用户习惯学习与个性化路由多模态扩展图像Token的计量与优化音视频内容的上下文管理 Runtime Complete - 完整代码请参见本文各章节实现") 关键词： Token Runtime, AI IDE, 成本控制, 性能优化, 预算管理, 上下文压缩, 缓存策略, 模型选择,
29210编辑于 2026-05-27
来自专栏养虾记
优化 OpenClaw Heartbeat，大幅减少 Token 消耗
完整实战指南：通过架构重构将HeartbeatToken消耗降低95%目录问题背景与痛点分析Heartbeat工作机制深度解析优化策略与架构重构详细实施步骤进阶优化技巧监控与故障排查优化效果量化分析总结与最佳实践一 ────────────────────┐│优化前的Token消耗结构│├──────────────────────────────────────────────────────────────── **如无异常→回复HEARTBEAT_OK**优化效果：字数：500字→50字Token：约800→约100节省：约87.5%4.3第三步：创建Cron任务4.3.1查看现有Cron任务展开代码语言：BashAI 7.1Token消耗对比优化前（每日）：项目次数单次Token总计TokenHeartbeat484,000192,000任务执行48包含在心跳中-总计--192,000优化后（每日）：项目次数单次Token $1.92$0.26$1.66每月$57.60$7.80$49.80每年$691.20$93.60$597.607.3性能对比指标优化前优化后提升心跳响应时间5-10秒1-2秒5x上下文长度5000+Token1800Token64%
4.2K21编辑于 2026-03-24
来自专栏Linux运维
SQL 优化：优化 SQL 语句，提高查询效率
无论是OLTP业务高并发写入，还是OLAP场景的大规模查询分析，SQL优化都是工程师必须掌握的核心能力。本文从原理到实践，系统讲解SQL优化的关键方法，帮助你在实际项目中显著提升查询效率。一、SQL优化的核心思路SQL优化的本质是：减少扫描、减少计算、减少数据量、减少等待。优化方式：使用索引字段排序避免对大表直接排序使用覆盖索引减少回表必要时使用临时表提前过滤四、执行计划分析（EXPLAIN）SQL优化必须依赖执行计划。常见选择：OLTP：READCOMMITTED金融类强一致：REPEATABLEREAD或SERIALIZABLE六、缓存与分库分表当SQL优化到极限后，需要从架构层面优化。：建组合索引(user_id,create_time)查询变为覆盖索引排序在索引中完成优化后耗时：5秒→20毫秒结语SQL优化不是单点技巧，而是一套系统方法：索引设计→SQL写法→执行计划分析→架构优化
75610编辑于 2026-01-13
来自专栏腾讯云数据库专家服务
MySQL案例：count(*)效率优化
前言阅读过上一篇文章的童鞋应该都知道，用count(1)替换count(*)，并不能起到优化作用，两者的执行效率是一样的。那么，count(*)应该如何优化呢？让我们继续往下看。那么为什么MySQL要从扫描聚集索引优化成扫描二级索引呢？表而言，主键即数据；聚集索引的叶子节点存放的是完整行记录，而二级索引的叶子节点存放的只是索引列+主键，因此二级索引要比聚集索引小，扫描成本会更低；而且，二级索引key_len越小，扫描成本就越低，执行效率就越高 -------------+-------------+ 16 rows in set, 1 warning (0.00 sec) （3）汇总数据如下表，二级索引key_len越小，扫描成本越小，执行效率越高 count(*)执行效率。
6.6K112发布于 2020-10-26
来自专栏C# 编程
SQLite执行效率优化结论
4）不能每次执行一条SQL语句前开始事务并在SQL语句执行之后提交事务，这样的执行效率同样是很慢，最好的情况下，是在开始事务后批量执行SQL语句，再提交事务，这样的效率是最高的。
1.6K30发布于 2019-05-24
来自专栏AI
AI模型的效率优化
AI模型的效率优化：量化与模型压缩技术随着人工智能（AI）技术的快速发展，AI模型的应用范围不断扩大，尤其是在计算资源有限的设备上，如移动设备、物联网（IoT）设备以及边缘计算环境中，AI模型的计算效率和存储需求变得至关重要为了确保这些模型能够在资源受限的环境中高效运行，模型的效率优化成为了研究和应用的关键问题。AI模型的效率优化主要集中在两个方面：模型量化和模型压缩。量化的挑战尽管量化能够显著提高模型的效率，但其也面临着精度损失的问题。为了避免精度损失，研究者提出了一些方法来优化量化过程。总结AI模型的效率优化技术，尤其是量化与模型压缩，是在计算资源有限的环境中部署高效AI应用的核心手段。量化通过减少模型参数的存储位数，能够显著提高推理速度并降低存储需求。而模型压缩技术，如剪枝、知识蒸馏和低秩分解，能够通过减少冗余信息来优化模型的复杂性和计算效率。在实际应用中，结合量化和模型压缩技术，可以为移动设备、嵌入式系统及边缘计算提供更为高效的AI解决方案。
1.1K00编辑于 2025-02-04
来自专栏全栈程序员必看
androidstudio 优化gradle编译效率
有时做少量改动编译须要等待时间过长，近期Erik Hellman编写的Boosting the performance for Gradle in your Android projects（译文參考1）提到了此问题的优化方法 2.4做了在编译性能方面做了不少优化，提高编译效率。
55310编辑于 2022-07-07
来自专栏FSociety
SQL中查询效率优化
当我们使用索引和不使用索引的时候，效率会相差相当大，特别是当数据量越来越大的时候。 FROM多个表的时候将小表写在后面，在CBO优化器情况下默认是将后表当成驱动表的。 ---- 写SQL简单，优化SQL难，数据分析师之路长的很，慢慢走～ peace~
3.8K30发布于 2018-09-11
Claude Code 省钱指南：Token 成本优化实战
用了ClaudeCode一段时间，发现Token消耗量比你想象的要高？这篇文章帮你系统性地降低Token成本。一、理解Token计费1.1输入Tokenvs输出TokenClaude的计费区分输入和输出：Token类型说明价格相对输入Token发送给Claude的内容（你的消息+文件+系统提示）较低输出TokenClaude 二、零成本优化：用好免费额度2.1识别高消耗场景消耗token的「大户」：场景典型消耗说明读取大文件10-100K+一次请求就消耗大量输入token长对话历史累计增长每轮对话都带上之前的内容反复读取相同文件浪费没有利用缓存输出生成高额输出 &&/cost知道钱花在哪，才能有针对性地优化。 3.2CLAUDE.md优化CLAUDE.md是缓存的「黄金地段」——每次请求都会带上，且位置靠前。
1.9K12编辑于 2026-05-24
Claude Code 省钱指南：Token 成本优化实战
用了 Claude Code 一段时间，发现 Token 消耗量比你想象的要高？这篇文章帮你系统性地降低 Token 成本。一、理解 Token 计费 1.1 输入 Token vs 输出 Token Claude 的计费区分输入和输出： Token 类型说明价格相对输入 Token 发送给 Claude 的内容（你的消息二、零成本优化：用好免费额度 2.1 识别高消耗场景消耗 token 的「大户」：场景典型消耗说明读取大文件 10-100K+ 一次请求就消耗大量输入 token 长对话历史累计增长每轮对话都带上之前的内容 /context && /cost 知道钱花在哪，才能有针对性地优化。 3.2 CLAUDE.md 优化 CLAUDE.md 是缓存的「黄金地段」——每次请求都会带上，且位置靠前。
30210编辑于 2026-06-15
来自专栏Coco的专栏
前端构建效率优化之路
FE 项目，在随着项目体量不断增大的过程中，对整体的打包构建效率的优化之路。基于上述的一些分析，本文将从如下几个方面探讨对构建效率优化的探索：基于 Webpack 的一些常见传统优化方式分模块构建基于 Vite 的构建工具切换基于 Es-build 插件的构建效率优化如果不替换掉 Webpack 本身，语言本身（NodeJS）的执行效率是没法优化的，只能在其他几个点做文章。，上述优化完成后，对整个项目的打包构建效率是有着一个比较大的提升的，但是这并非已经做到了最好。构建效率优化可能会处于一种一直在路上的状态。当然，这里不一定有最佳实践，只有最适合我们项目的实践，需要我们不断地去摸索尝试。
1.7K20编辑于 2022-09-19
来自专栏未来先知
创新之举：不丢 Token，大语言模型效率提升 35% !
作者解决了两个挑战： 1）研究上下文中文本中重要Token的分布情况，发现近来的Token比远期的Token更具有重要性； 2）通过跨层共享注意力分数优化远程Token的资源分配。这带来了两个挑战： 1）一个Token要关注哪些重要的Token，重要Token的分布在哪里？ 2）如何优化不那么重要的Token的内存和计算。为了实现这一目标，作者提出了PoD（近端Token优化远程Token）方法，在解码阶段优化推理效率。此外，还有一些方法通过直接压缩输入Prompt的长度来提高效率。本工作与这些方法相互独立，并主要集中在优化解码阶段。使用了50亿条数据进行训练。从优化的角度来看，作者大致将这些方法分为以下几类：近年来的研究从两个方向优化了上下文计算（Fu, 2024），即预填充和解码。
94610编辑于 2025-02-12
来自专栏Java编程指南
IDEA 配置优化提高开发效率
去掉烦人的indent提示### 如何去掉呢? 打开IDEA 的preferences|Editor|Code Style, 去掉下图中的两个勾选: 设置文件的模板### 我们创建一个java文件时
1.2K20发布于 2019-08-02
来自专栏媒矿工厂
优化 Facebook 视频的存储效率
这意味着我们需要：更高效的硬件更多的加速器，更多的软件优化，如视频生命周期管理或视频存储策略 FB 视频存储策略下面将介绍 Facebook 是如何管理它的视频存储的。我们可以用效益成本评估器来代替生命周期冲突中管理编码的静态规则，回想一下前面的重新压缩编码操作会带来计算机成本，我们还需要在存储和质量之间进行权衡，这是一个适合效益成本评估的情况，这样我们就有了编码管理的第三个选择，这将帮助我们实现更好的视频存储效率
1.9K30发布于 2021-12-02
来自专栏DataFunTalk
罗景：连接效率优化实践
图片 ---- 导读：本次分享由以下几个部分构成—— 58的业务背景综合排序框架效率优化框架基础数据流程（数据）策略优化路径（算法）效率优化平台（工程）总结和思考 -- 01 58的业务背景在上述粗排、精排以及调序三个阶段中，算法团队重点输出了质量治理，效率优化以及流量调控三种核心能力。 -- 03 效率优化框架效率优化框架由三部分组成：数据、算法以及工程。在进行效率优化框架设计和迭代过程中，主要结合相关业务，对策略的相关优化路径进行迭代更新，最后对相关技术以及方案进行相关积累，形成平台化沉淀，方便以后复用。优化路径，包括：策略优化路径和效率优化平台。关于策略优化路径，主要分为四个阶段：反馈策略。关于效率优化平台，主要针对日志合并清洗，特征工程，模型训练评估以及上线验证四个阶段进行优化。进一步对效率优化平台进行介绍：主要针对日志系统，日志样本，机器学习，上线试验以及线上系统进行相关优化。
59010编辑于 2022-06-11
来自专栏JavaEdge
Netflix云计算效率优化秘诀！
数据与洞察组织与我们的工程团队密切合作，共享关键的效率指标，使内部利益相关者能够做出明智的业务决策。 Cloud Efficiency Analytics (CEA)云效率分析：该组件建立在 FPD 的基础上，提供一个分析数据层，在各种业务用例中提供时间序列效率指标。数据原则作为效率指标的真实来源，我们团队的任务是提供准确、可靠和可访问的数据，提供全面的文档资料，以便在复杂的效率空间中游刃有余，并提供定义明确的服务水平协议（SLA），以便在延迟、中断或变更期间与下游消费者达成期望我们的目标是通过预测分析和 ML 来优化使用和检测成本中的异常情况，从而转向主动方法。负责：中央/分销预订系统性能优化活动&券等营销中台建设交易平台及数据中台等架构和开发设计车联网核心平台-物联网连接平台、大数据平台架构设计及优化 LLM Agent应用开发区块链应用开发
23510编辑于 2025-06-01
来自专栏code人生
使用联合索引优化查询效率
在数据库设计和查询优化中，联合索引是一个强大的工具，它可以显著提高数据检索的速度。然而，要充分利用联合索引的优势，我们需要理解它们是如何影响查询效率的。本文将探讨联合索引的工作原理以及如何使用它们来优化查询。联合索引的工作原理联合索引的原理基于数据库管理系统（DBMS）如何存储和检索数据的方式。这种索引类型允许数据库在执行查询时，同时利用多个列的索引，从而提高数据检索的效率。索引的效率取决于查询条件如何与索引列的顺序匹配。数据库在处理查询时，会按照索引定义中的列顺序从左到右匹配条件。如果查询的第一个条件是索引的第一个列，那么数据库可以高效地利用索引。但是，当范围查询介入时，索引的效率可能会降低，因为数据库需要遍历更多的索引项来找到所有匹配的记录。
1.5K10编辑于 2024-06-11
多模态理解模型的Token消耗优化策略
摘要：多模态理解模型按Token消耗量计费，优化Token使用是控制成本的关键。理解这些规律，是制定Token消耗优化策略的基础。 6.3 定期评估优化效果 Token消耗优化是一个持续的过程。建议定期（如每月）对优化措施的效果进行评估，包括：平均单次调用的Token消耗量是否下降不同优化措施的实际降本效果优化措施是否对理解准确性产生影响基于定期评估的结果，持续调整和优化Token消耗策略七、成本与效果的平衡 7.1 避免过度优化 Token消耗优化需要在成本和效果之间取得平衡。过度追求Token消耗的降低，可能会对理解准确性产生负面影响，反而导致业务质量的下降。
15110编辑于 2026-06-18

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

大模型应用：本地大模型部署中的Token效率优化与性能分析.9

优化python执行效率

Token Runtime：成本控制与性能优化

优化 OpenClaw Heartbeat，大幅减少 Token 消耗

SQL 优化：优化 SQL 语句，提高查询效率

MySQL案例：count(*)效率优化

SQLite执行效率优化结论

AI模型的效率优化

androidstudio 优化gradle编译效率

SQL中查询效率优化

Claude Code 省钱指南：Token 成本优化实战

Claude Code 省钱指南：Token 成本优化实战

前端构建效率优化之路

创新之举：不丢 Token，大语言模型效率提升 35% !

IDEA 配置优化提高开发效率

优化 Facebook 视频的存储效率

罗景：连接效率优化实践

Netflix云计算效率优化秘诀！

使用联合索引优化查询效率

多模态理解模型的Token消耗优化策略

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

大模型应用：本地大模型部署中的Token效率优化与性能分析.9

优化python执行效率

Token Runtime：成本控制与性能优化

优化 OpenClaw Heartbeat，大幅减少 Token 消耗

SQL 优化：优化 SQL 语句，提高查询效率

MySQL案例：count(*)效率优化

SQLite执行效率优化结论

AI模型的效率优化

androidstudio 优化gradle编译效率

SQL中查询效率优化

Claude Code 省钱指南：Token 成本优化实战

Claude Code 省钱指南：Token 成本优化实战

前端构建效率优化之路

创新之举：不丢 Token，大语言模型效率提升 35% !

IDEA 配置优化 提高开发效率

优化 Facebook 视频的存储效率

罗景：连接效率优化实践

Netflix云计算效率优化秘诀！

使用联合索引优化查询效率

多模态理解模型的Token消耗优化策略

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

IDEA 配置优化提高开发效率