大模型部署 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签大模型部署

#大模型部署

AGI大模型应用：从模型到产品的工程化蜕变

用户12645013 1小时前2026-07-23 13:44:53

2025 年，大模型的技术曲线正在趋缓——模型参数量不再是新闻头条，多模态能力逐渐成为标配，上下文窗口从 128K 卷到 10M 也接近边际效应递减。真正发生剧...

300

从零构建一个基于大模型的 ReAct 智能体：原理、实现与调优

用户12645013 1小时前2026-07-23 13:41:51

大语言模型（LLM）展示了惊人的推理能力，但其本质仍是“静态知识库”——它无法主动获取实时信息，也无法执行外部操作。例如，当你问“今天石家庄天气如何？”模型只能...

500

大模型GPU服务资源与性能监控：基于ChatGLM3模型的自动化巡检应用实践.174

未闻花名 4小时前2026-07-23 10:21:00

传统业务监控只关注接口响应、CPU内存、网络状态，完全适配不了大模型推理场景。大模型服务监控是面向推理全链路的专属可观测体系，覆盖请求接入、文本分词、模型前向计...

200

从零到部署：我用Node.js+Express+MySQL撸了一个宠物服务小程序后台

搜weiranit 20小时前2026-07-22 18:20:34

前阵子接了个私活，帮一家社区宠物店做个小程序。需求不复杂：首页能看banner和分类，能按条件筛选服务项目，最关键的是用户能在线预约并完成支付。

1100

我用Python+OpenCV做了一个数码管数字识别工具

搜weiranit 21小时前2026-07-22 18:14:31

上个月接了一个小需求：帮朋友识别一批老旧设备上的数码管读数。设备没有数据接口，只能拍照再人工录入，一天拍几百张图，眼睛都快看花了。

1610

从源码剖析 vLLM 的显存管理与连续批处理：大模型推理吞吐量提升 20 倍的底层密码

用户12339161 21小时前2026-07-22 17:58:40

vLLM 通过 PagedAttention 和 Continuous Batching 两大杀手锏，将吞吐量提升 20 倍以上。本文将深入 vLLM 源码目录...

2910

封神与阵痛：Kimi K3 的破局、狂欢与中国大模型的“甜蜜负担”

jack.yang 21小时前2026-07-22 17:33:17

2026年7月17日，当这款拥有2.8万亿参数的混合专家（MoE）大模型悄然上线时，整个全球科技圈迎来了一场久违的震动。在Artificial Analysis...

4220

DeepSeek AI 大模型开发全流程：从裸机部署到业务融合的工程实践指南

用户12502927 23小时前2026-07-22 15:48:56

在思否的问答区，我经常看到两类问题：一类是“为什么我的Prompt（提示词）总是不起作用？”，另一类是“微调了7B模型为什么反而变笨了？”。

2700

Apache SeaTunnel AI CLI Benchmark：7 款大模型、100 个 ETL 任务实测，谁真正能跑起来？

Apache SeaTunnel 1天前2026-07-22 14:46:04

摘要：大模型正在快速进入数据工程领域，承担理解自然语言需求、生成 ETL 任务配置、校验配置，以及在执行失败后协助定位和修复问题等工作。对团队而言，真正困难的...

3210

大模型微调成本分析：LoRA、QLoRA与全参数微调的经济性对比与企业落地策略

网渡科技 1天前2026-07-22 14:17:23

DeepSpeed ZeRO论文指出，通过优化器状态切分，可以显著降低大模型训练显存需求，使万亿参数模型训练成为可能。参考：

3010

AI到底会抢走谁的饭碗？它省钱还是烧钱？

用户12552614 1天前2026-07-22 13:56:05

这两年，ChatGPT火遍全网，Midjourney画得比美院毕业生还快，Sora直接生成视频。朋友圈里人人都在转“某某职业要被AI取代了”。恐慌是真的，但恐慌...

2110

哪些中转站可以接入 Codex？五类平台完整对比

ai建国 1天前2026-07-22 11:26:56

Codex 官方宣布支持第三方模型后，最常见的困惑是：到底哪些中转站/API 网关可以用？国内能直连吗？Fenno 怎么配？这篇文章把目前主流的五类接入方案逐一...

5200

Gemini 3.5 Pro 延期、Gemini 3.6 Flash 发布即翻车：谷歌三款新模型全景解读与选型建议

ai建国 1天前2026-07-22 10:18:37

2026 年 7 月 21 日，谷歌 DeepMind 一口气发布 Gemini 3.6 Flash、Gemini 3.5 Flash-Lite 和网络安全模型...

9710

#大模型部署

AGI大模型应用：从模型到产品的工程化蜕变

从零构建一个基于大模型的 ReAct 智能体：原理、实现与调优

大模型GPU服务资源与性能监控：基于ChatGLM3模型的自动化巡检应用实践.174

从零到部署：我用Node.js+Express+MySQL撸了一个宠物服务小程序后台

我用Python+OpenCV做了一个数码管数字识别工具

从源码剖析 vLLM 的显存管理与连续批处理：大模型推理吞吐量提升 20 倍的底层密码

封神与阵痛：Kimi K3 的破局、狂欢与中国大模型的“甜蜜负担”

DeepSeek AI 大模型开发全流程：从裸机部署到业务融合的工程实践指南

Apache SeaTunnel AI CLI Benchmark：7 款大模型、100 个 ETL 任务实测，谁真正能跑起来？

大模型微调成本分析：LoRA、QLoRA与全参数微调的经济性对比与企业落地策略

AI到底会抢走谁的饭碗？它省钱还是烧钱？

哪些中转站可以接入 Codex？五类平台完整对比

Gemini 3.5 Pro 延期、Gemini 3.6 Flash 发布即翻车：谷歌三款新模型全景解读与选型建议

热门专栏

GPUS开发者

贾志刚-OpenCV学堂

畅所欲言

Rainbond开源「容器云平台」

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐