搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏技术专栏全家桶
大模型之DeepSeek-OCR2快速入门实战教程
DeepSeek团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文，并开源DeepSeek-OCR 2模型，采用创新的DeepEncoder V2方法，让AI能够根据图像的含义动态重排图像的各个部分项目地址：https://github.com/deepseek-ai/DeepSeek-OCR-2 论文地址：https://github.com/deepseek-ai/DeepSeek-OCR-2 /blob/main/DeepSeek_OCR2_paper.pdf 模型地址：https://huggingface.co/deepseek-ai/DeepSeek-OCR-2 DeepSeek OCR /deepseek-ocr modelscope download --model deepseek-ai/DeepSeek-OCR-2 --local_dir . /DeepSeek-OCR-2.git cd DeepSeek-OCR-2 创建 Conda 环境： conda create -n deepseek-ocr2 python=3.12.9 -y conda
2.8K10编辑于 2026-02-03
来自专栏前端必修课
DeepSeek 文生图实战指南
我是程序员 NEO 让我们开始今天的技术分享~ 想让 DeepSeek 生成精美图片吗？本文将为您揭示一个简单而强大的解决方案，让您轻松实现 AI 创意的可视化呈现。突破 DeepSeek 的限制 DeepSeek 作为新晋的 AI 助手，虽然在对话能力上表现出色，但并不直接支持图像生成功能。不过，通过本文介绍的方法，我们可以轻松突破这一限制，让 DeepSeek 秒变"画家"。核心解决方案关键在于利用 Pollinations.ai 提供的图像生成 API。 =100&model=flux&nologo=true 参数说明： width/height：控制图片尺寸 seed：随机种子，保证图片的可重复性 nologo=true：去除水印，获得清晰原图实战指南
1K11编辑于 2025-03-07
来自专栏老张的求知思考世界
DeepSeek原理与项目实战
目前关注度较高的是基础语言理解（DeepSeek LLM）、代码生成（DeepSeek Coder/Coder V2）、数学推理（DeepSeek Math）、多模态交互（DeepSeek VL）和第三代混合专家模型（DeepSeek V2/V3）等七种模型。当技术爆炸遇见知识鸿沟，《DeepSeek 原理与项目实战》这本兼顾理论深度、技术广度和实践经验的好书，便为读者打开了通向DeepSeek世界的大门。 Part.2 动手玩转DeepSeek 本书旨在为读者提供一份系统性的学习指南，按照“生成式AI的基础与技术架构——生成式AI的专业应用与 Prompt 设计——实战与高级集成应用”三部分来组织内容，通过理论讲解与实用案例相结合的方式集成实战1：基于LLM的Chat类客户端开发集成实战2：AI 智能助理开发集成实战3：基于VS Code的辅助编程插件开发 Part.3 结语在当下大模型技术快速迭代的浪潮中，本书以技术前瞻性、实战系统性和应用普适性形成显著特色
87610编辑于 2025-03-10
来自专栏大模型成长之路
【大模型学习 | RAG & DeepSeek 实战】
Deepseek & RAG 实战编者常常有许多材料需要阅读查阅，但自己又比较懒，为此，想在大模型的学习过程中基于RAG技术将本地知识库与大模型结合起来，加快自身的效率。在本次的项目设计，需要达成以下目标：开源大模型的本地部署及使用（以Deepseek为例）； PDF文本分析 ➕ 相似prompt检索提取（关键）；将检索到的信息与原prompt结合作为输入，得到结果检索Top3结果：参考1 - 8 -（境外生排位第一）获得省部级及以上学科竞赛奖项，奖励金额参考2 1.学校对获得省部级及以上学科竞赛奖项的学生给予奖励，参考3 培训费以及学生奖金等。参考2 第三章赛事分类与级别认定第七条根据学科竞赛的组织机构、专业度、社会影响和获 - 4 - 奖难度等方面综合考虑，将竞赛分为国家级、省部级、地厅级和校级赛事。 : f"""请根据以下参考内容回答问题： {retrieved} 问题：{query}"""}]4️⃣ 模型部署mode_name_or_path = '/root/autodl-tmp/deepseek-ai
1.1K31编辑于 2025-07-19
DeepSeek R2 要来了？
虽然官方还没正式官宣，但这两天科技圈已经被DeepSeek R2的传闻刷屏了！从X（原推特）到科技论坛，各路消息满天飞——有说这周就要发布的，有爆料技术参数的，甚至还有讨论华为芯片的。用户@kimmonismus神秘兮兮地说"DeepSeek R2越来越近了"，@imjustnewatai更是直接押注"本周必发"。 Wccftech等外媒虽然跟风报道，但连个发布日期都说不准，DeepSeek官微更是安静如鸡。行业地震正在进行时别看R2还没露脸，它家前作R1早就把市场搅得天翻地覆了。 MIT协议真香直接叫板GPT-4 V3 2025.3升级 6710亿文本图片视频全拿下硬件效率吊打同行 R2（网传）可能本周 1.2万亿核弹价格低到友商想报警华为芯+推理视觉双修写在最后：不管真假，DeepSeek已经赢了就算R2的爆料最后被"打脸"，DeepSeek这套组合拳也够漂亮。
40411编辑于 2025-06-09
来自专栏后端架构师
Claude Code 接入 DeepSeek V4 实战：400 万 Tokens 从 26 降到 2
DeepSeek V4 到底是什么规格先把背景说清楚，后面算费用才有意义。 DeepSeek V4 分两个版本：V4-Flash 和 V4-Pro。 V4-Pro 是这次的主角。如果回复里提到 DeepSeek 或者响应格式正常，说明配置成功。顺便去 DeepSeek 控制台看一下 Usage，有请求进来就稳了。排查了半天才想起来：DeepSeek V4-Pro 目前不支持图片输入。这是最大的坑。如果你的工作流里经常需要上传截图、UI 设计稿、日志截图，DeepSeek V4 目前是做不了的。 DeepSeek 不识别这个名字，会自动 fallback 到 deepseek-v4-flash，悄悄切换你不一定察觉。记得明确指定模型名。坑2：base URL 带了 /v1 标准 OpenAI 格式的 base URL 通常是 https://api.example.com/v1，但 DeepSeek 的 Anthropic 兼容端点是
1.7K10编辑于 2026-05-08
来自专栏大模型成长之路
【大模型学习 | RAG & DeepSeek 实战（二）】
Deepseek & RAG 实战（二）在【大模型学习 | RAG & DeepSeek 实战】-腾讯云开发者社区-腾讯云文章中，已经实现了基于RAG建立了本地知识库，通过检索相似度最高的知识来辅助大模型的问答系统 rerank 模型（如 BGE-Reranker、ColBERT），对多个段落的得分进行重排序，具体实现：1️⃣ 将 (query, paragraph) 成对送入 BERT/Transformer 分类器2️⃣ paragraphs = cache["paragraphs"] doc_embeddings = cache["embeddings"]index = faiss.IndexFlatL2( 为此，需要对存储向量进行压缩.在原来的代码中,我们没有采用任何的向量压缩,采用了最简单和最基础的检索方式IndexFlatL2,通过欧氏距离进行相似度计算,为了加快检索速度, faiss提供了多种压缩方式 → 用 8bit 表示每个子块index = faiss.IndexPQ(d, M=8, nbits=8)d: 向量维度（如 384）M: 子向量数量（压缩块）nbits: 每块用几位表示（8bit）2️⃣
92221编辑于 2025-07-20
来自专栏GiantPandaCV
如何看待 DeepSeek 发布的 MoE 大模型 DeepSeek-V2？
/DeepSeek-V2/blob/main/config.json-ai/DeepSeek-V2/blob/main/config.json 以 A800 8x80G 单节点为例，总显存大小共 640GB DeepSeekV2 和 DeepSeek-67B 的 KVCache 估计计算成本上，理论计算量为 FLOPs=2ND，则两者的比值是：实际的推理成本比值是带宽读取时间 + 计算时间，无论是 Memory 按照 DeepSeek V2 的设计，Attention 部分的 weight 大小是大于 6 个 Expert 的 weight 的，即激活参数中，Attention 占比超过 50%。（不做限制的话，最多可以到 6 个 GPU 上） DeepSeek MoE 部分， Ns=2，Kr=6 总共的 Expert 数量是 162 个。与 LLaMa3 不同的是， DeepSeekV2 有多处很有分量的原创工作，甚至有可能引领全球 LLM 的发展潮流，非常值得赞赏！也为 DeepSeek 是一个中国 team 感到自豪。
94020编辑于 2025-02-03
来自专栏h5
基于Tauri2+Vue3.5+DeepSeek实战客户端Ai流式对话exe应用
2025又一跨平台AI原创力作：tauri2+vite6+deepseek从0-1搭建桌面端ai聊天问答系统。 tauri2-deepseek采用无边框圆角窗口、自定义导航条设计，自定义托盘图标。项目环境变量.env# 项目名称VITE_APPNAME = 'Tauri2-DeepSeek'# 运行端口VITE_PORT = 1420# DeepSeek API配置VITE_DEEPSEEK_API_KEY { "$schema": "https://schema.tauri.app/config/2", "productName": "tauri2-deepseek", "version": "0.1.0 ", "identifier": "com.tauri2-deepseek.app", "build": { "beforeDevCommand": "yarn dev", "devUrl
59420编辑于 2025-06-19
来自专栏AI SPPECH
11：DeepSeek-OCR-2 深度解析
作者： HOS(安全风信子) 日期： 2026-02-05 主要来源平台： ModelScope 摘要： DeepSeek-OCR-2 作为 DeepSeek 团队开源的第二代 OCR 模型，基于团队推出的 DeepSeek-OCR-2 正是为了解决这些痛点而生。根据 ModelScope 平台的最新动态，DeepSeek-OCR-2 采用了全新的技术架构，实现了语义推理级的文档理解能力，为各类文档处理场景提供了更强大的解决方案。 2. 架构 DeepEncoder V2 是 DeepSeek-OCR-2 的核心特征提取架构，相比第一代有了显著改进： # DeepEncoder V2 核心实现 class DeepEncoderV2( -2 文档理解服务") as demo: gr.Markdown("# DeepSeek-OCR-2 文档理解服务") gr.Markdown("基于DeepSeek-OCR-2的文档理解服务
86310编辑于 2026-02-08
腾讯云 DeepSeek 系列模型部署HAI实战
在这一技术浪潮中，国内头部云厂商加速布局AI基础设施与工具链建设，其中腾讯云凭借其Deepseek系列大模型与**高性能AI计算实例（HAI）**的深度整合，为开发者提供了从模型训练到应用落地的全栈解决方案操作过程：第一步：跳转链接https://cloud.tencent.com/act/pro/deepseek2025#HAI-CPU购买一个体验版的HAI，用于本次部署HAI的必要条件；第二步：点击立即购买选择一个可以购买的资源所以说要选择一个可以购买的进行支付即可；第三步：进行支付支付成功：选择已成功支付即可；第四步：登录cnb.cool地址登录成功：第五步：跳转这个地址https://cnb.cool/ai-awesome/deepseek 但是如果只是根据视频进行搭建还是会存在一定的问题，只有实际搭建的时候，才会发现一些问题，当然了搭建好了模型之后只是第一步，如何根据搭建的服务进行调用，才是最重要的，这个点后续会继续更新对应的文章进行介绍，毕竟现在搭建deepseek
57321编辑于 2025-03-23
来自专栏人工智能极简应用
AI智能体研发之路-模型篇（二）：DeepSeek-V2-Chat 训练与推理实战
一、引言 5月6日私募基金幻方发布DeepSeek-V2，千亿级模型，每百万Tokens仅需1元-2元。而被誉为大模型价格屠夫的“DeepSeek-V2”到底是怎么个事儿，是否可以进行训练和推理，今天我们来展开讲一讲。二、模型简介 2.1 DeepSeek V2模型概述 DeepSeek V2（Moe）是一个基于专家网络（MoE）的大语言模型，是DeepSeek LLM（dense）的升级版本。 2.2 DeepSeek V2模型架构 DeepSeek-V2针对attention机制和MoE网络进行创新，保证经济的训练和高效的推理：对于注意力，设计了MLA（多头潜在注意力），它利用低秩键值联合压缩来消除推理时键值缓存的瓶颈三、训练与推理 3.1 DeepSeek V2模型训练由于机器资源限制，这里基于QLoRA指令微调（SFT）DeepSeek V2的lite版（DeepSeek-V2-Lite-Chat），使用之前文章介绍的
2.4K10编辑于 2024-08-13
来自专栏网络虚拟化
如何评价 Deepseek 新发布的 DeepSeek-Prover-V2-671B 模型?
2025 年 4 月，DeepSeek 放大招，推出了 DeepSeek-Prover-V2-671B，参数高达 6710 亿，专为在 Lean 4 语言里证明数学定理而生。 DeepSeek-Prover-V2-671B 的横空出世可是个大跃进，实力已经能跟一些人类专家过过招了。模型架构：大而灵活混合专家的路子 DeepSeek-Prover-V2-671B 是从 DeepSeek-V3-Base 改出来的，用了个叫混合专家（MoE）的架构，总参数有 6710 亿，但实际干活时只调大概训练过程：数据加聪明算法先打基础 DeepSeek-Prover-V2-671B 从 DeepSeek-V3-Base 开始，这是个在 14.8 万亿 token 上预训练的模型，数学、代码、Lean 最后说两句 DeepSeek-Prover-V2-671B 是 AI 证明数学定理的一个大步。它的 MoE 架构、智能训练和开源让人眼前一亮，在 MiniF2F、PutnamBench 上成绩亮眼。
50310编辑于 2025-05-04
来自专栏golang云原生new
Statefulset实战 2
上一部分我们分享到，Statefulset 部署应用，我们需要完成这些资源的创建：制作应用程序和镜像编写 Service 编写 Statefulset 指定 pod 模板及挂载我们已经完成前面 2 apiVersion: apps/v1 kind: StatefulSet metadata: name: sta-kubia spec: serviceName: sta-kubia replicas: 2 storage: 1Mi accessModes: - ReadWriteOnce 设置 statefulset 自身的名称为 sta-kubia，设置 2 查看持久化卷声明 pvc 和查看持久化卷 pv kubectl get pvc kubectl get pv 我们可以看到查看持久化卷声明 pvc 和查看持久化卷 pv，总共分别有 2 proxy 会去代理到 8001 端口继续向下访问 kubectl 又会将请求代理到 ApiServer 上，此时请求的是 Apiserver 的地址:8443 端口，看到这里，整个请求实际上是经过了 2
31510编辑于 2023-09-01
来自专栏yeedomliu
OAuth 2实战
图 2-1　授权码许可的详细过程为了最大限度地保持灵活性，OAuth协议去除了真实API系统的很多细节。 2所示）。例如，为了能读取照片，照片打印服务可以向照片存储服务请求访问权限图 2-2　将资源拥有者引导至授权服务器以启动授权流程然后，授权服务器会要求用户进行身份认证。 4　资源拥有者批准客户端的授权请求图 2-5　将授权码发送给客户端这一步采用HTTP重定向的方式，回到客户端的redirect_uri。，如果请求有效，则颁发令牌（如图2-7所示）。
1.6K30编辑于 2022-12-03
如何用DeepSeek优化代码生成？实战案例分析
实战案例分析一、DeepSeek的技术特点与优势DeepSeek是一款基于大规模预训练模型的代码生成工具，具有以下特点和优势：多任务能力：支持代码生成、代码补全、代码优化等多种任务。二、实战案例：使用DeepSeek生成代码案例1：快速生成快速排序算法以下是使用DeepSeek生成快速排序算法的代码示例：from transformers import AutoTokenizer, 以下是优化前的代码：def fib(n): if n <= 2: return n return fib(n-1) + fib(n-2)通过DeepSeek优化后，可以得到如下代码 (n): if n <= 0: return 0 elif n == 1: return 1 a, b = 0, 1 for _ in range(2, 提供清晰的需求描述明确的需求描述可以帮助DeepSeek更好地理解意图。例如，以下是一个清晰的需求：# 生成一个Python爬虫，爬取豆瓣电影Top250，保存到CSV文件2.
1.7K10编辑于 2025-04-06
来自专栏人工智能
腾讯云AI实战：DeepSeek模型训练与微调
2、HAI平台还有就是HAI平台，它是腾讯云提供的高性能AI计算平台，支持大规模分布式训练和推理。HAI平台的核心功能包括下面几点：高性能计算：支持大规模GPU集群，加速训练和推理。 DeepSeek致力于研究和开发先进的通用人工智能模型AGI，其模型包括DeepSeek LLM、DeepSeek MoE、DeepSeek V2、DeepSeek-V3等，并且全部开源‌。 2、编写训练脚本编写训练脚本，使用DeepSeek模型进行训练，这里用一个简单的训练脚本示例来给大家分享，具体如下所示：import tencentcloud from tencentcloud.tione.v20211111 2、编写微调脚本然后编写微调脚本，使用DeepSeek模型进行微调，这里分享一个简单的微调脚本示例，具体如下所示：# 微调脚本 import tencentcloud from tencentcloud.tione.v20211111 ), ResourceLimits=models.ResourceLimits(MaxNumberOfTrainingJobs=10, MaxParallelTrainingJobs=2)
4.2K82编辑于 2025-02-06
来自专栏技术专栏全家桶
OpenClaw整合DeepSeek、Kimi模型并嵌入飞书实战
01、接入Kimi-K2.5模型上一篇总结了OpenClaw的运行原理和基于MimiMax模型的部署实战：Agent之最新OpenClaw原理与实战大全这篇将整合DeepSeek和Kimi模型，OpenClaw 2月1日，OpenClaw宣布，用户可以免费调用Kimi K2.5模型以及Kimi Coding相关能力。 Kimi K2.5，成为首个被OpenClaw官方点名、对用户开放免费额度的主力模型。部署前的核心准备硬件配置建议 OpenClaw对硬件有一定要求：推荐机型：MacMini（M1/M2/M4芯片）是社区公认的最佳宿主，能效比高，适合24小时挂机。 02、接入DeepSeek OpenClaw里面的列出来的模型里面没有deepseek。 : { "deepseek": { "baseUrl": "https://api.deepseek.com/v1", "apiKey": "${DEEPSEEK_API_KEY
14.5K24编辑于 2026-03-05
来自专栏网络安全技术点滴分享
DeepseekScanner deepseek+python实现代码审计实战
一、功能概述 DeepseekScanner实现了扫描源代码项目中的所有代码文件发送给deepseek进行安全审计的功能。具体细节包括扫描所有子目录中的代码文件，然后依次将代码文件切片发送到deepseek api进行智能代码审计。审计结果包含存在安全问题的代码文件、代码位置行数、安全漏洞问题名称、存在安全漏洞的代码块。 save_results_to_file(filepath, file_scan_results) except Exception as e: print(e) 2. 代码文件切片发送给deepseek做安全审计 //从项目中的各个目录提取代码文件后，开始对代码进行切片发送给deepseek做安全审计 def scan_file(file_path, scan_results return None 三、测试结果 1.命令执行 //对项目中的所有代码进行安全审计 python scanner.py E:\work\sqli-secound-order --all 2.
56910编辑于 2025-06-16
-DeepSeek技术解析：MoE架构实现与代码实战
以下是一篇结合DeepSeek技术解析与代码示例的技术文章，重点展示其核心算法实现与落地应用：DeepSeek技术解析：MoE架构实现与代码实战作为中国AI领域的创新代表，DeepSeek在混合专家模型本文将通过代码实例解析其核心技术，并展示如何基于DeepSeek-MoE框架实现高效推理。 DeepSeek的「专家位置感知调度」算法通过：预分析计算图，将高频共现的专家分配到同物理设备采用RDMA网络传输协议，降低跨节点通信延迟一、MoE架构设计原理DeepSeek的稀疏化MoE架构通过动态路由机制 torch.nn.functional as Fclass DeepSeekMoE(nn.Module): def __init__(self, dim=768, num_experts=8, top_k=2) 未来应用deepseek将更加广泛
1.5K10编辑于 2025-03-15

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

大模型之DeepSeek-OCR2快速入门实战教程

DeepSeek 文生图实战指南

DeepSeek原理与项目实战

【大模型学习 | RAG & DeepSeek 实战】

DeepSeek R2 要来了？

Claude Code 接入 DeepSeek V4 实战：400 万 Tokens 从 26 降到 2

【大模型学习 | RAG & DeepSeek 实战（二）】

如何看待 DeepSeek 发布的 MoE 大模型 DeepSeek-V2？

基于Tauri2+Vue3.5+DeepSeek实战客户端Ai流式对话exe应用

11：DeepSeek-OCR-2 深度解析

腾讯云 DeepSeek 系列模型部署HAI实战

AI智能体研发之路-模型篇（二）：DeepSeek-V2-Chat 训练与推理实战

如何评价 Deepseek 新发布的 DeepSeek-Prover-V2-671B 模型?

Statefulset实战 2

OAuth 2实战

如何用DeepSeek优化代码生成？实战案例分析

腾讯云AI实战：DeepSeek模型训练与微调

OpenClaw整合DeepSeek、Kimi模型并嵌入飞书实战

DeepseekScanner deepseek+python实现代码审计实战

-DeepSeek技术解析：MoE架构实现与代码实战

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐