首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏技术专栏全家桶

    大模型之DeepSeek-OCR2快速入门实战教程

    DeepSeek团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分 项目地址:https://github.com/deepseek-ai/DeepSeek-OCR-2 论文地址:https://github.com/deepseek-ai/DeepSeek-OCR-2 /blob/main/DeepSeek_OCR2_paper.pdf 模型地址:https://huggingface.co/deepseek-ai/DeepSeek-OCR-2 DeepSeek OCR /deepseek-ocr modelscope download --model deepseek-ai/DeepSeek-OCR-2 --local_dir . /DeepSeek-OCR-2.git cd DeepSeek-OCR-2 创建 Conda 环境: conda create -n deepseek-ocr2 python=3.12.9 -y conda

    2.8K10编辑于 2026-02-03
  • 来自专栏前端必修课

    DeepSeek 文生图实战指南

    我是程序员 NEO 让我们开始今天的技术分享~ 想让 DeepSeek 生成精美图片吗?本文将为您揭示一个简单而强大的解决方案,让您轻松实现 AI 创意的可视化呈现。 突破 DeepSeek 的限制 DeepSeek 作为新晋的 AI 助手,虽然在对话能力上表现出色,但并不直接支持图像生成功能。 不过,通过本文介绍的方法,我们可以轻松突破这一限制,让 DeepSeek 秒变"画家"。 核心解决方案 关键在于利用 Pollinations.ai 提供的图像生成 API。 =100&model=flux&nologo=true 参数说明: width/height:控制图片尺寸 seed:随机种子,保证图片的可重复性 nologo=true:去除水印,获得清晰原图 实战指南

    1K11编辑于 2025-03-07
  • 来自专栏老张的求知思考世界

    DeepSeek原理与项目实战

    目前关注度较高的是基础语言理解(DeepSeek LLM)、代码生成(DeepSeek Coder/Coder V2)、数学推理(DeepSeek Math)、多模态交互(DeepSeek VL)和第三代混合专家模型 (DeepSeek V2/V3)等七种模型。 当技术爆炸遇见知识鸿沟,《DeepSeek 原理与项目实战》这本兼顾理论深度、技术广度和实践经验的好书,便为读者打开了通向DeepSeek世界的大门。 Part.2 动手玩转DeepSeek 本书旨在为读者提供一份系统性的学习指南,按照“生成式AI的基础与技术架构——生成式AI的专业应用与 Prompt 设计——实战与高级集成应用”三部分来组织内容,通过理论讲解与实用案例相结合的方式 集成实战1:基于LLM的Chat类客户端开发 集成实战2:AI 智能助理开发 集成实战3:基于VS Code的辅助编程插件开发 Part.3 结语 在当下大模型技术快速迭代的浪潮中,本书以技术前瞻性、实战系统性和应用普适性形成显著特色

    87610编辑于 2025-03-10
  • 来自专栏大模型成长之路

    【大模型学习 | RAG & DeepSeek 实战

    Deepseek & RAG 实战 编者常常有许多材料需要阅读查阅,但自己又比较懒,为此,想在大模型的学习过程中基于RAG技术将本地知识库与大模型结合起来,加快自身的效率。 在本次的项目设计,需要达成以下目标: 开源大模型的本地部署及使用 (以Deepseek为例); PDF文本分析 ➕ 相似prompt检索提取 (关键); 将检索到的信息与原prompt结合作为输入,得到结果 检索Top3结果:参考1 - 8 -(境外生排位第一)获得省部级及以上学科竞赛奖项,奖励金额参考2 1.学校对获得省部级及以上学科竞赛奖项的学生给予奖励,参考3 培训费以及学生奖金等。 参考2 第三章 赛事分类与级别认定 第七条 根据学科竞赛的组织机构、专业度、社会影响和获 - 4 - 奖难度等方面综合考虑,将竞赛分为国家级、省部级、地厅级和 校级赛事。 : f"""请根据以下参考内容回答问题: {retrieved} 问题:{query}"""}]4️⃣ 模型部署mode_name_or_path = '/root/autodl-tmp/deepseek-ai

    1.1K31编辑于 2025-07-19
  • DeepSeek R2 要来了?

    虽然官方还没正式官宣,但这两天科技圈已经被DeepSeek R2的传闻刷屏了!从X(原推特)到科技论坛,各路消息满天飞——有说这周就要发布的,有爆料技术参数的,甚至还有讨论华为芯片的。 用户@kimmonismus神秘兮兮地说"DeepSeek R2越来越近了",@imjustnewatai更是直接押注"本周必发"。 Wccftech等外媒虽然跟风报道,但连个发布日期都说不准,DeepSeek官微更是安静如鸡。 行业地震正在进行时 别看R2还没露脸,它家前作R1早就把市场搅得天翻地覆了。 MIT协议真香 直接叫板GPT-4 V3 2025.3升级 6710亿 文本图片视频全拿下 硬件效率吊打同行 R2(网传) 可能本周 1.2万亿核弹 价格低到友商想报警 华为芯+推理视觉双修 写在最后 :不管真假,DeepSeek已经赢了 就算R2的爆料最后被"打脸",DeepSeek这套组合拳也够漂亮。

    40411编辑于 2025-06-09
  • 来自专栏后端架构师

    Claude Code 接入 DeepSeek V4 实战:400 万 Tokens 从 26 降到 2

    DeepSeek V4 到底是什么规格 先把背景说清楚,后面算费用才有意义。 DeepSeek V4 分两个版本:V4-Flash 和 V4-Pro。 V4-Pro 是这次的主角。 如果回复里提到 DeepSeek 或者响应格式正常,说明配置成功。顺便去 DeepSeek 控制台看一下 Usage,有请求进来就稳了。 排查了半天才想起来:DeepSeek V4-Pro 目前不支持图片输入。 这是最大的坑。如果你的工作流里经常需要上传截图、UI 设计稿、日志截图,DeepSeek V4 目前是做不了的。 DeepSeek 不识别这个名字,会自动 fallback 到 deepseek-v4-flash,悄悄切换你不一定察觉。记得明确指定模型名。 坑2:base URL 带了 /v1 标准 OpenAI 格式的 base URL 通常是 https://api.example.com/v1,但 DeepSeek 的 Anthropic 兼容端点是

    1.7K10编辑于 2026-05-08
  • 来自专栏大模型成长之路

    【大模型学习 | RAG & DeepSeek 实战(二)】

    Deepseek & RAG 实战(二)在【大模型学习 | RAG & DeepSeek 实战】-腾讯云开发者社区-腾讯云文章中,已经实现了基于RAG建立了本地知识库,通过检索相似度最高的知识来辅助大模型的问答系统 rerank 模型(如 BGE-Reranker、ColBERT),对多个段落的得分进行重排序,具体实现:1️⃣ 将 (query, paragraph) 成对送入 BERT/Transformer 分类器2️⃣ paragraphs = cache["paragraphs"] doc_embeddings = cache["embeddings"]index = faiss.IndexFlatL2( 为此,需要对存储向量进行压缩.在原来的代码中,我们没有采用任何的向量压缩,采用了最简单和最基础的检索方式IndexFlatL2,通过欧氏距离进行相似度计算,为了加快检索速度, faiss提供了多种压缩方式 → 用 8bit 表示每个子块index = faiss.IndexPQ(d, M=8, nbits=8)d: 向量维度(如 384)M: 子向量数量(压缩块)nbits: 每块用几位表示(8bit)2️⃣

    92221编辑于 2025-07-20
  • 来自专栏GiantPandaCV

    如何看待 DeepSeek 发布的 MoE 大模型 DeepSeek-V2

    /DeepSeek-V2/blob/main/config.json-ai/DeepSeek-V2/blob/main/config.json 以 A800 8x80G 单节点为例, 总显存大小共 640GB DeepSeekV2DeepSeek-67B 的 KVCache 估计 计算成本上,理论计算量为 FLOPs=2ND,则两者的比值是: 实际的推理成本比值是 带宽读取时间 + 计算时间,无论是 Memory 按照 DeepSeek V2 的设计,Attention 部分的 weight 大小是大于 6 个 Expert 的 weight 的,即激活参数中,Attention 占比超过 50%。 (不做限制的话,最多可以到 6 个 GPU 上) DeepSeek MoE 部分, Ns=2,Kr=6 总共的 Expert 数量是 162 个。 与 LLaMa3 不同的是, DeepSeekV2 有多处很有分量的原创工作,甚至有可能引领全球 LLM 的发展潮流,非常值得赞赏!也为 DeepSeek 是一个中国 team 感到自豪。

    94020编辑于 2025-02-03
  • 来自专栏h5

    基于Tauri2+Vue3.5+DeepSeek实战客户端Ai流式对话exe应用

    2025又一跨平台AI原创力作:tauri2+vite6+deepseek从0-1搭建桌面端ai聊天问答系统。 tauri2-deepseek采用无边框圆角窗口、自定义导航条设计,自定义托盘图标。 项目环境变量.env# 项目名称VITE_APPNAME = 'Tauri2-DeepSeek'# 运行端口VITE_PORT = 1420# DeepSeek API配置VITE_DEEPSEEK_API_KEY { "$schema": "https://schema.tauri.app/config/2", "productName": "tauri2-deepseek", "version": "0.1.0 ", "identifier": "com.tauri2-deepseek.app", "build": { "beforeDevCommand": "yarn dev", "devUrl

    59420编辑于 2025-06-19
  • 来自专栏AI SPPECH

    11:DeepSeek-OCR-2 深度解析

    作者: HOS(安全风信子) 日期: 2026-02-05 主要来源平台: ModelScope 摘要: DeepSeek-OCR-2 作为 DeepSeek 团队开源的第二代 OCR 模型,基于 团队推出的 DeepSeek-OCR-2 正是为了解决这些痛点而生。 根据 ModelScope 平台的最新动态,DeepSeek-OCR-2 采用了全新的技术架构,实现了语义推理级的文档理解能力,为各类文档处理场景提供了更强大的解决方案。 2. 架构 DeepEncoder V2DeepSeek-OCR-2 的核心特征提取架构,相比第一代有了显著改进: # DeepEncoder V2 核心实现 class DeepEncoderV2( -2 文档理解服务") as demo: gr.Markdown("# DeepSeek-OCR-2 文档理解服务") gr.Markdown("基于DeepSeek-OCR-2的文档理解服务

    86310编辑于 2026-02-08
  • 腾讯云 DeepSeek 系列模型部署HAI实战

    在这一技术浪潮中,国内头部云厂商加速布局AI基础设施与工具链建设,其中腾讯云凭借其Deepseek系列大模型与**高性能AI计算实例(HAI)**的深度整合,为开发者提供了从模型训练到应用落地的全栈解决方案 操作过程:第一步:跳转链接https://cloud.tencent.com/act/pro/deepseek2025#HAI-CPU购买一个体验版的HAI,用于本次部署HAI的必要条件;第二步:点击立即购买选择一个可以购买的资源 所以说要选择一个可以购买的进行支付即可;第三步:进行支付支付成功:选择已成功支付即可;第四步:登录cnb.cool地址登录成功:第五步:跳转这个地址https://cnb.cool/ai-awesome/deepseek 但是如果只是根据视频进行搭建还是会存在一定的问题,只有实际搭建的时候,才会发现一些问题,当然了搭建好了模型之后只是第一步,如何根据搭建的服务进行调用,才是最重要的,这个点后续会继续更新对应的文章进行介绍,毕竟现在搭建deepseek

    57321编辑于 2025-03-23
  • 来自专栏人工智能极简应用

    AI智能体研发之路-模型篇(二):DeepSeek-V2-Chat 训练与推理实战

    一、引言 5月6日私募基金幻方发布DeepSeek-V2,千亿级模型,每百万Tokens仅需1元-2元。 而被誉为大模型价格屠夫的“DeepSeek-V2”到底是怎么个事儿,是否可以进行训练和推理,今天我们来展开讲一讲。 二、模型简介 2.1 DeepSeek V2模型概述 DeepSeek V2(Moe)是一个基于专家网络(MoE)的大语言模型,是DeepSeek LLM(dense)的升级版本。 2.2 DeepSeek V2模型架构 DeepSeek-V2针对attention机制和MoE网络进行创新,保证经济的训练和高效的推理: 对于注意力,设计了MLA(多头潜在注意力),它利用低秩键值联合压缩来消除推理时键值缓存的瓶颈 三、训练与推理 3.1 DeepSeek V2模型训练 由于机器资源限制,这里基于QLoRA指令微调(SFT)DeepSeek V2的lite版(DeepSeek-V2-Lite-Chat),使用之前文章介绍的

    2.4K10编辑于 2024-08-13
  • 来自专栏网络虚拟化

    如何评价 Deepseek 新发布的 DeepSeek-Prover-V2-671B 模型?

    2025 年 4 月,DeepSeek 放大招,推出了 DeepSeek-Prover-V2-671B,参数高达 6710 亿,专为在 Lean 4 语言里证明数学定理而生。 DeepSeek-Prover-V2-671B 的横空出世可是个大跃进,实力已经能跟一些人类专家过过招了。 模型架构:大而灵活 混合专家的路子 DeepSeek-Prover-V2-671B 是从 DeepSeek-V3-Base 改出来的,用了个叫混合专家(MoE)的架构,总参数有 6710 亿,但实际干活时只调大概 训练过程:数据加聪明算法 先打基础 DeepSeek-Prover-V2-671B 从 DeepSeek-V3-Base 开始,这是个在 14.8 万亿 token 上预训练的模型,数学、代码、Lean 最后说两句 DeepSeek-Prover-V2-671B 是 AI 证明数学定理的一个大步。它的 MoE 架构、智能训练和开源让人眼前一亮,在 MiniF2F、PutnamBench 上成绩亮眼。

    50310编辑于 2025-05-04
  • 来自专栏golang云原生new

    Statefulset实战 2

    上一部分我们分享到,Statefulset 部署应用,我们需要完成这些资源的创建: 制作应用程序和镜像 编写 Service 编写 Statefulset 指定 pod 模板及挂载 我们已经完成前面 2 apiVersion: apps/v1 kind: StatefulSet metadata: name: sta-kubia spec: serviceName: sta-kubia replicas: 2 storage: 1Mi accessModes: - ReadWriteOnce 设置 statefulset 自身的名称为 sta-kubia,设置 2 查看 持久化卷声明 pvc 和 查看 持久化卷 pv kubectl get pvc kubectl get pv 我们可以看到 查看 持久化卷声明 pvc 和 查看 持久化卷 pv,总共分别有 2 proxy 会去代理到 8001 端口继续向下访问 kubectl 又会将请求代理到 ApiServer 上,此时请求的是 Apiserver 的地址:8443 端口,看到这里,整个请求实际上是经过了 2

    31510编辑于 2023-09-01
  • 来自专栏yeedomliu

    OAuth 2实战

    2-1 授权码许可的详细过程 为了最大限度地保持灵活性,OAuth协议去除了真实API系统的很多细节。 2所示)。 例如,为了能读取照片,照片打印服务可以向照片存储服务请求访问权限 图 2-2 将资源拥有者引导至授权服务器以启动授权流程 然后,授权服务器会要求用户进行身份认证。 4 资源拥有者批准客户端的授权请求 图 2-5 将授权码发送给客户端 这一步采用HTTP重定向的方式,回到客户端的redirect_uri。 ,如果请求有效,则颁发令牌(如图2-7所示)。

    1.6K30编辑于 2022-12-03
  • 如何用DeepSeek优化代码生成?实战案例分析

    实战案例分析一、DeepSeek的技术特点与优势DeepSeek是一款基于大规模预训练模型的代码生成工具,具有以下特点和优势:多任务能力:支持代码生成、代码补全、代码优化等多种任务。 二、实战案例:使用DeepSeek生成代码案例1:快速生成快速排序算法以下是使用DeepSeek生成快速排序算法的代码示例:from transformers import AutoTokenizer, 以下是优化前的代码:def fib(n): if n <= 2: return n return fib(n-1) + fib(n-2)通过DeepSeek优化后,可以得到如下代码 (n): if n <= 0: return 0 elif n == 1: return 1 a, b = 0, 1 for _ in range(2, 提供清晰的需求描述明确的需求描述可以帮助DeepSeek更好地理解意图。例如,以下是一个清晰的需求:# 生成一个Python爬虫,爬取豆瓣电影Top250,保存到CSV文件2.

    1.7K10编辑于 2025-04-06
  • 来自专栏人工智能

    腾讯云AI实战DeepSeek模型训练与微调

    2、HAI平台还有就是HAI平台,它是腾讯云提供的高性能AI计算平台,支持大规模分布式训练和推理。HAI平台的核心功能包括下面几点:高性能计算:支持大规模GPU集群,加速训练和推理。 DeepSeek致力于研究和开发先进的通用人工智能模型AGI,其模型包括DeepSeek LLM、DeepSeek MoE、DeepSeek V2DeepSeek-V3等,并且全部开源‌。 2、编写训练脚本编写训练脚本,使用DeepSeek模型进行训练,这里用一个简单的训练脚本示例来给大家分享,具体如下所示:import tencentcloud from tencentcloud.tione.v20211111 2、编写微调脚本然后编写微调脚本,使用DeepSeek模型进行微调,这里分享一个简单的微调脚本示例,具体如下所示:# 微调脚本 import tencentcloud from tencentcloud.tione.v20211111 ), ResourceLimits=models.ResourceLimits(MaxNumberOfTrainingJobs=10, MaxParallelTrainingJobs=2)

    4.2K82编辑于 2025-02-06
  • 来自专栏技术专栏全家桶

    OpenClaw整合DeepSeek、Kimi模型并嵌入飞书实战

    01、接入Kimi-K2.5模型 上一篇总结了OpenClaw的运行原理和基于MimiMax模型的部署实战:Agent之最新OpenClaw原理与实战大全 这篇将整合DeepSeek和Kimi模型,OpenClaw 2月1日,OpenClaw宣布,用户可以免费调用Kimi K2.5模型以及Kimi Coding相关能力。 Kimi K2.5,成为首个被OpenClaw官方点名、对用户开放免费额度的主力模型。 部署前的核心准备 硬件配置建议 OpenClaw对硬件有一定要求: 推荐机型:MacMini(M1/M2/M4芯片)是社区公认的最佳宿主,能效比高,适合24小时挂机。 02、接入DeepSeek OpenClaw里面的列出来的模型里面没有deepseek。 : { "deepseek": { "baseUrl": "https://api.deepseek.com/v1", "apiKey": "${DEEPSEEK_API_KEY

    14.5K24编辑于 2026-03-05
  • 来自专栏网络安全技术点滴分享

    DeepseekScanner deepseek+python实现代码审计实战

    一、功能概述 DeepseekScanner实现了扫描源代码项目中的所有代码文件发送给deepseek进行安全审计的功能。 具体细节包括扫描所有子目录中的代码文件,然后依次将代码文件切片发送到deepseek api进行智能代码审计。审计结果包含存在安全问题的代码文件、代码位置行数、安全漏洞问题名称、存在安全漏洞的代码块。 save_results_to_file(filepath, file_scan_results) except Exception as e: print(e) 2. 代码文件切片发送给deepseek做安全审计 //从项目中的各个目录提取代码文件后,开始对代码进行切片发送给deepseek做安全审计 def scan_file(file_path, scan_results return None 三、测试结果 1.命令执行 //对项目中的所有代码进行安全审计 python scanner.py E:\work\sqli-secound-order --all 2.

    56910编辑于 2025-06-16
  • -DeepSeek技术解析:MoE架构实现与代码实战

    以下是一篇结合DeepSeek技术解析与代码示例的技术文章,重点展示其核心算法实现与落地应用:DeepSeek技术解析:MoE架构实现与代码实战作为中国AI领域的创新代表,DeepSeek在混合专家模型 本文将通过代码实例解析其核心技术,并展示如何基于DeepSeek-MoE框架实现高效推理。 DeepSeek的 「专家位置感知调度」 算法通过:预分析计算图,将高频共现的专家分配到同物理设备采用RDMA网络传输协议,降低跨节点通信延迟一、MoE架构设计原理DeepSeek的稀疏化MoE架构通过动态路由机制 torch.nn.functional as Fclass DeepSeekMoE(nn.Module): def __init__(self, dim=768, num_experts=8, top_k=2) 未来应用deepseek将更加广泛

    1.5K10编辑于 2025-03-15
领券