搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏AI工程落地
DeepSeek V4模型原理
这个Attention有三块功能构成：1.KV Compressor负责把N个token的KV压缩成1个，在DeepSeek V4系列模型里，N=4。2.Lightning Indexer再从压缩后的KV里挑选top-k个KV参与注意力计算，DeepSeek V4 Flash模型的k=512，Pro模型的k=1024。3.因为KV Compressor会把多个token压缩，压缩后的KV Entriy内部的token之间是无法相互看到的，而且语言模型对最近的token是高度依赖的。所以需要维护滑动窗口（Sliding Window），保留一些最近的未压缩KV，弥补压缩带来的损失。一般，sliding window=128。
20010编辑于 2026-05-09
来自专栏Java面试教程
DeepSeek V4 真要来了！
大家可能听说过很多次，DeepSeek V4就要爱了，这一次可能是最靠谱的时间点了。就在上周，多位知情人士透露，DeepSeek创始人梁文锋在内部已经明确了节奏：下一代旗舰大模型V4，计划于4月下旬正式与公众见面。但这一次，DeepSeek V4干了一件牛逼的事情：完全运行在华为昇腾950PR芯片之上，底层代码从CUDA全面转向华为自研的CANN框架。这意味着什么？但其实我觉得 DeepSeek V4 虽然会比 V3 更好，但一定没有大家像之前期待的那么炸裂。我们应该用正常的眼光来看待更多“平凡、也会犯错的 DeepSeek"，哪怕崩溃了，V4 不那么惊艳，也并不影响 DeepSeek 的历史地位，已经它仍然是一家巨牛逼的公司。
38420编辑于 2026-04-20
来自专栏机器学习与统计学
DeepSeek V4 Flash 量化版火了
最近 HuggingFace 上有个 DeepSeek V4 Flash 量化版突然火了——更狠的是，作者是 antirez（Redis 作者 Salvatore Sanfilippo）我查了一下简介事情其实是这样的：antirez 同步开源了两件配套的事： DeepSeek V4 Flash 的专用量化版 GGUF：托管在 huggingface.co/antirez/deepseek-v4 -gguf DwarfStar 4（简称 ds4）：一个专门为 DeepSeek V4 Flash 设计的推理引擎，托管在 github.com/antirez/ds4 注意定语：ds4 不是通用 GGUF V4 Flash，这套组合是当前能找到的"最爽配置"之一 4. 通用性差是事实不要指望它能跑 Qwen、Llama、其他 DeepSeek——它就只跑 V4 Flash，换模型就得换引擎总结 ds4 + DeepSeek V4 Flash GGUF 这套组合，是
72310编辑于 2026-05-19
DeepSeek V4是什么？能做什么？
DeepSeek V4不只是聊天机器人，它是能真正干活的AI助手。一、DeepSeek V4是什么？ 2026年4月24日，DeepSeek发布V4预览版，两个版本： V4-Pro：完整版，Agent能力强，推理性能顶级 V4-Flash：轻量版，速度快，成本低核心能力：百万字上下文：一次能读1M 保存为result.xlsx" 效果：一次生成可运行的代码自动处理异常情况代码质量接近中级工程师水平真实案例：某开发团队用DeepSeek V4写代码，从"半天一个功能"到"1小时一个功能"， 4 代码能力： V4-Pro接近Claude 4 Sonnet 长文本处理： V4（1M）> Claude（200K）成本： V4更低中文优化： V4更好 ▪ 5.3 vs DeepSeek V3 需要更高级功能，升级到Pro版一句话带走： DeepSeek V4不是聊天机器人，是你的AI工作伙伴。
1.5K10编辑于 2026-04-28
来自专栏用户2059497的专栏（2）
【DeepSeek实战】驾驭千亿参数：DeepSeek V4 Prompt 工程最佳实践
驾驭千亿参数：DeepSeek V4 Prompt 工程最佳实践摘要: DeepSeek V4 拥有强大的逻辑推理与代码生成能力，但如何"用好"它是一门艺术。结构化提示词框架 (CRISPE) 一个优秀的 Prompt 应包含以下要素：图2：CRISPE 框架六大要素及其在 DeepSeek V4 中的应用要素说明示例 C - Capacity/ 实测数据: 在数学推理任务中，CoT 可使 DeepSeek V4 的准确率从 68% 提升至 91%。图3：普通 Prompt vs CoT Prompt 在复杂逻辑任务中的准确率对比 3. JSON Mode 结构化输出 DeepSeek V4 支持强制输出 JSON 格式，极大简化后端解析逻辑。关注我，获取《DeepSeek V4 企业级应用实战》系列最新文章！ ✍️ 行文仓促，定有不足之处，欢迎各位朋友在评论区批评指正，不胜感激!
25510编辑于 2026-06-02
来自专栏大模型系列
微调实战：DeepSeek V4领域适配完全指南
对于V4这样庞大的MoE模型，微调不仅是提升性能的手段，更是实现商业价值最大化的必经之路。第二章：微调前的准备工作成功的微调始于周密的准备。本章将指导你完成环境、硬件和数据的搭建。自动检测load_in_4bit=True#使用4-bit量化#加载基础模型model,tokenizer=FastLanguageModel.from_pretrained(model_name="deepseek-ai /DeepSeek-V4-Flash",max_seq_length=max_seq_length,dtype=dtype,load_in_4bit=load_in_4bit,)4.3应用LoRA适配器展开代码语言 ,r=16,#LoRA秩target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"],#V4 在昇腾CANN软件栈上直接运行这些框架进行V4微调，仍面临兼容性挑战。可行路径：混合模式：在NVIDIAGPU上完成微调，导出FP16或INT4格式的模型，然后将微调后的模型部署到昇腾平台进行推理。
37610编辑于 2026-05-15
来自专栏苏三说技术
GPT5.5 和 DeepSeek V4，哪个更好？
DeepSeek V4：结构性的成本革命 DeepSeek V4的核心突破在于解决了超长上下文大模型在推理阶段的效率瓶颈。三、开源护城河 vs 商业生态圈 DeepSeek V4：深植开源社区，构建开发者生态完全开源：采用MIT协议，个人和企业均可免费下载权重并商用，显著降低了技术门槛。如果希望完全掌控模型并实现私有化部署，DeepSeek V4是明确的选择。但如果追求极致的性能上限和完备的官方工具链，GPT-5.5依然是难以绕过的标杆。四、总结回到最初的问题：GPT-5.5和DeepSeek V4，哪个更好？数据高度敏感，要求完全合规 ✅ DeepSeek V4系列完全开源，支持私有化部署且适配华为昇腾芯片，可控性高。
70910编辑于 2026-04-28
来自专栏用户2059497的专栏（2）
【DeepSeek 实战】打造全能编程助手：DeepSeek V4 Agent 开发与工具调用
打造全能编程助手：DeepSeek V4 Agent 开发与工具调用摘要: Agent（智能体）是大模型应用的高级形态。本文详解如何利用 DeepSeek V4 的 Function Calling 能力，构建能够自主调用外部工具的编程助手。 Bug 位置，生成修复代码，运行单元测试验证，最后提交 Git Commit 价值: 将开发者从重复性工作中解放出来，专注于架构设计与核心逻辑图1：Agent 从代码审查到自动修复的完整流程 DeepSeek V4 强大的 Function Calling 能力使其能够理解工具的功能描述，并在需要时主动调用。定义工具 Schema 首先，我们需要告诉 DeepSeek V4 有哪些工具可用，以及每个工具的参数格式。
9010编辑于 2026-06-03
来自专栏热度文章
别卷了，DeepSeek V4 来交卷了
去年DeepSeek的产品线是分开的：V3干通用的活，R1专门搞推理。 DeepSeek从V3.1开始也走了这条路，V4当然也是混合架构。所以R2这个代号，大概率就这么退休了。就像OpenAI的o3，也成了最后一代独立推理模型，直接被吞进了GPT-5。在很多人觉得“参数规模不太重要了”的今天，DeepSeek用V4说了一句：大就是有效，大就是聪明，大就是领先。但“大”也有代价。参数涨了，推理成本就压不住。比架构更值得关注的：国产算力V4发布当天，华为云就宣布昇腾超节点完成全栈适配。这背后工程量有多大？DeepSeek需要把大量原本跑在NVIDIAGPU上的CUDA代码，迁移到华为的CANN架构上。 DeepSeek作为国内最强开源力量，正在用V4把国产算力生态拉进真正的实战场景。而且MIT许可证全开源，任何人都能拿去用、拿去改、拿去商用。写在最后V4这次发布，没有去年R1那种颠覆式的震撼。
39331编辑于 2026-04-24
DeepSeek V4 来了，它到底比别人强在哪？
不用技术背景，看懂 DeepSeek V4 创新和差异～同一天，OpenAI 发布了 GPT-5.5。DeepSeek 也发了 V4。 DeepSeek V4 的核心优势在第三个维度：同等效果下，成本砍掉了大半。一个长上下文，卡了行业两年要理解 DeepSeek V4 做了什么，先理解这个问题：为什么 AI 很难"读长文"？ DeepSeek V4 的核心创新：把长文"压一压" DeepSeek V4 的技术团队想到一个办法：先压缩，再处理。想象你要读一篇 1000 页的报告。正常方式：把每一页都完整保留，互相比对。短板：上下文只有 128K，相比 DeepSeek V4 的 100 万差距明显。 2026.04GLM-5.1（智谱）方向：工程级 Agent + 减少幻觉。 MetaLLaMA 4 Scout 方向最激进：10M（1000 万）token 上下文，比 DeepSeek V4 还多 10 倍。用 iRoPE 交错位置编码实现。
15420编辑于 2026-06-02
来自专栏石云升
DeepSeek 新版本（V4?），内附升级方法
DeepSeek 更新了V4？下午5点左右，DeepSeek更新了一个新模型，据说是个小模型，整理能力我个人觉得比3.2是强一点的，但还比不上谷歌的Gemini 3，所以不确定是不是V4。是不是很神奇，其实离DeepSeek R1发布才1年多，恍如隔世。
1.5K10编辑于 2026-03-17
DeepSeek V4模型技术参数与性能分析
中国AI实验室DeepSeek推出了其最新大语言模型DeepSeek V4的两个预览版本，这是对去年V3.2模型及伴随的R1推理模型的备受期待的更新，后者曾席卷AI领域。该公司表示，DeepSeek V4 Flash和V4 Pro均为混合专家（Mixture-of-Experts）模型，每个模型拥有100万token的上下文窗口——足以让大型代码库或文档用于提示词中。 DeepSeek表示，由于架构改进，这两个模型比DeepSeek V3.2更高效、性能更佳，并且在推理基准上几乎“缩小了”与当前领先模型（无论是开放还是闭源）的差距。在编程竞赛基准中，DeepSeek表示两款V4模型的性能“与GPT-5.4相当”。 V4 Flash和V4 Pro都仅支持文本，不像许多闭源同行那样支持理解并生成音频、视频和图像。值得注意的是，DeepSeek V4比当今任何前沿模型都便宜得多。
71310编辑于 2026-04-25
来自专栏Hello工控
把DeepSeek V4接入RealPLC，实现PLC自动编程！
昨天我们介绍了Deepseek V4 Pro预览版正式上线！它的PLC编程能力到底如何？那对于我们RealPLC而言，必须实时更新下，把这个模型都接入进来。 01 申请DeepSeek API 我们首先到DeepSeek开发者平台，获取到API KEY。这是最重要的一步。 Step1：登录DeepSeek官网。在设置界面里： AI提供方选择DeepSeek，模型任选一个，DeepSeek的API密钥填写刚刚保存备用的KEY。BaseURL填写：确定好保存更改即可。然后我们可以用专家场景里面的PID应用来测试下DeepSeek V4 Pro生成西门子PLC程序效果：我们进入服务器后台可以看到，Job ID已经生成了，说明DeepSeek成功响应：再回到我们的web
67610编辑于 2026-04-28
来自专栏用户2059497的专栏（2）
【DeepSeek 实战】降本增效：DeepSeek V4 推理成本控制与生产环境监控
降本增效：DeepSeek V4 推理成本控制与生产环境监控摘要: 大模型应用落地，成本是关键考量。本文系统讲解 DeepSeek V4 在生产环境中的成本控制策略：包括响应缓存、批量处理、流式输出优化、Token 预算管理等。 V4 在企业内部的广泛应用，API 调用量呈指数级增长。成本构成分析 DeepSeek V4 计费模式项目价格（示例）说明输入 Token ¥2 / 1M tokens Prompt 中的字符输出 Token ¥8 / 1M tokens 模型生成的字符 [1h]) - 错误率 rate(deepseek_api_calls_total{status="error"}[5m]) > 5% 预算使用率 deepseek_active_requests -
1500编辑于 2026-06-05
来自专栏Hello工控
如何在Claude Code里面用上DeepSeek V4 Pro模型？
最后就是把Claude环境和模型配置下：上图就是我们申请的DeepSeek API key。具体申请步骤参考：把DeepSeek V4接入RealPLC，实现PLC自动编程！ ="<your DeepSeek API Key>" $env:ANTHROPIC_MODEL="deepseek-v4-pro[1m]" $env:ANTHROPIC_DEFAULT_OPUS_MODEL ="deepseek-v4-flash" $env:CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash" $env:CLAUDE_CODE_EFFORT_LEVEL /anthropic", "ANTHROPIC_AUTH_TOKEN":"<your DeepSeek API Key>", "ANTHROPIC_MODEL":"deepseek-v4 我们为了确认链接成功，可以问下它是谁，用的是哪家大模型，确定回复为deepseek-v4-pro。那么，这个时候你就可以愉快地使用这个CC和Deepseek V4 Pro开启AI编程对话之旅了。
7.6K10编辑于 2026-04-28
来自专栏大模型系列
万亿参数震撼发布：DeepSeek V4 MoE架构深度解析
一、前言：超越“更大即更好”的新范式2026年4月24日，深度求索（DeepSeek）正式开源发布DeepSeek-V4系列预览版，一举引爆全球AI圈。这种精细化的工程调优，使得V4能够在保持极高稀疏度的同时，依然获得稳定的训练效果和卓越的推理性能。五、性能基准与实测对比DeepSeek官方及社区的多项基准测试表明，V4系列模型在多个维度上均达到了国际领先水平。这些数据充分证明了V4“高效超大规模”理念的成功。它不仅在能力上不输于顶级闭源模型，在成本和效率上更是实现了降维打击。六、应用场景与开发者生态V4的发布，为开发者和企业打开了全新的应用可能性。 6.2开发者支持DeepSeek为V4提供了全面的开发者工具链：开源权重：在HuggingFace上免费提供，MIT协议允许商用。
68330编辑于 2026-05-14
把小龙虾切换到DeepSeek V4版吧
DeepSeek V4版出来了，官方称目前是开源AI的最高分，堪比闭源的模型，优于Sonnet 4.5，虽然kimi 2.6也推出了，我还是切换到了DeepSeek Pro版本。返回正题：如何用小龙虾配置DeepSeek V4 Pro。 1，充值打开DeepSeek 开放平台（https://platform.deepseek.com/usage），充值走起。 ": "deepseek-v4-flash", "name": "DeepSeek V4 Flash"}, {"id": "deepseek-v4-pro", "name": "DeepSeek V4 Pro"} ] } 4，更新openclaw 新版本支持DeepSeek V4： # 升级到最新版（全局） npm i -g openclaw@latest # 检查版本，应该变成 2026.4 .x 或更新 openclaw -v 5，设置配置DeepSeek V4 Pro 关掉已有的openclaw： pkill -f openclaw pkill -f node 然后运行刚才设计apikey
81710编辑于 2026-04-30
来自专栏用户2059497的专栏（2）
【DeepSeek实战】DeepSeek V4 API 生产级接入：异步流式调用与高可用架构实战
DeepSeek V4 API 生产级接入：异步流式调用与高可用架构实战摘要: 本文深入探讨 DeepSeek V4 API 在企业级应用中的生产级接入方案。面对 DeepSeek V4 强大的千亿参数 MoE 架构，如何挖掘其性能潜力、保障服务稳定性并控制成本，是每个开发者必须面对的课题。本文将带你从零构建一个生产级的 DeepSeek V4 代理网关，涵盖异步并发、流式输出、自动重试及实时监控四大核心模块。 DeepSeek V4 API 核心特性解析 DeepSeek V4 作为最新一代混合专家 (MoE) 模型，其 API 设计充分考虑了大规模应用场景的需求：特性说明优势 128K 长上下文支持超长文本输入与检索实时 Token 计费监控 DeepSeek V4 采用按 Token 计费的商业模式。我们需要在每次调用后解析响应头，统计成本。
34710编辑于 2026-05-26
来自专栏子晓AI量化
分享免费体验gpt-image-2、deepseek v4的途径
最近gpt-image-2生图、 deepseek v4模型比较火，有同学想尝试一把。问我有没有推荐的途径一些同学要么是因为没好用的魔法，要么是觉得需要花钱。这里推荐几种免费体验的途径。 2、 deepseek v4 deepseek v4 分为2个版本， deepseek v4 flash 和 deepseek v4 pro。其实官网价格也还好，不算太贵。 https://zenmux.ai/invite/RU59J6 baseurl: https://zenmux.ai/api/v1 模型：deepseek-v4-pro-free 配置上自己的密钥。
47610编辑于 2026-05-07
DeepSeek V4长上下文推理与NVIDIA Blackwell架构
V4进行构建。 DeepSeek V4也可通过NVIDIA NIM在Day 0下载，以便部署以构建长上下文编码、文档分析和代理工作流，使用熟悉的API模式。驱动代理工作流DeepSeek V4特别适合代理，因为它在长上下文编排、推理和工具调用方面表现出色。开发人员可以将DeepSeek V4配置为大语言模型：NVIDIA NemoClaw：在安全的OpenShell环境中运行OpenClaw，创建一个由DeepSeek V4驱动的长期运行的个人助手，用于代码生成该蓝图基于LangChain Deep Agents，具有可扩展性，可以轻松将DeepSeek V4添加到工作流中进行编排和规划。
37010编辑于 2026-05-06

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

DeepSeek V4模型原理

DeepSeek V4 真要来了！

DeepSeek V4 Flash 量化版火了

DeepSeek V4是什么？能做什么？

【DeepSeek实战】驾驭千亿参数：DeepSeek V4 Prompt 工程最佳实践

微调实战：DeepSeek V4领域适配完全指南

GPT5.5 和 DeepSeek V4，哪个更好？

【DeepSeek 实战】打造全能编程助手：DeepSeek V4 Agent 开发与工具调用

别卷了，DeepSeek V4 来交卷了

DeepSeek V4 来了，它到底比别人强在哪？

DeepSeek 新版本（V4?），内附升级方法

DeepSeek V4模型技术参数与性能分析

把DeepSeek V4接入RealPLC，实现PLC自动编程！

【DeepSeek 实战】降本增效：DeepSeek V4 推理成本控制与生产环境监控

如何在Claude Code里面用上DeepSeek V4 Pro模型？

万亿参数震撼发布：DeepSeek V4 MoE架构深度解析

把小龙虾切换到DeepSeek V4版吧

【DeepSeek实战】DeepSeek V4 API 生产级接入：异步流式调用与高可用架构实战

分享免费体验gpt-image-2、deepseek v4的途径

DeepSeek V4长上下文推理与NVIDIA Blackwell架构

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐