搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏自然语言处理
基于MinerU的PDF解析API
基于MinerU的PDF解析A - MinerU的GPU镜像构建 - 基于FastAPI的PDF解析接口支持一键启动，已经打包到镜像中，自带模型权重，支持GPU推理加速，GPU速度相比CPU每页解析要快几十倍不等进行表格识别；光学字符识别：使用PaddleOCR进行文本识别；镜像地址：阿里云地址：docker pull registry.cn-beijing.aliyuncs.com/quincyqiang/mineru :0.2-models dockerhub地址：docker pull quincyqiang/mineru:0.2-models 启动命令： docker run -itd --name=mineru_server --gpus=all -p 8888:8000 quincyqiang/mineru:0.2-models 具体截图请见博客：https://cloud.tencent.com/developer/article
2.7K11编辑于 2024-11-23
MinerU的python接口使用例子
参考官方例子：mineru.readthedocs.io/en/latest/user_guide/quick_start/to_markdown.html 本地文件例子： import os from
86910编辑于 2025-07-22
来自专栏姓王者的博客
国产开源的文档转换器:MinerU
简介 MinerU是由OpenDataLab团队打造的大模型时代的文档提取/转换神器支持PDF、Word、PPT等多种文档的智能解析，可用于机器学习、大模型语料生产、RAG等场景特点多语种支持多类型支持
98010编辑于 2025-03-28
来自专栏python前行者
MinerU、Magic-PDF、Magic-Doc
关于 MinerU MinerU 是一款一站式、开源、高质量的数据提取工具，主要包含以下功能: Magic-PDF PDF文档提取 Magic-Doc 网页与电子书提取 github： https:// github.com/opendatalab/MinerU/blob/master/README_zh-CN.md 在线体验地址： https://opendatalab.com/OpenSourceTools /Extractor/PDF https://www.modelscope.cn/studios/OpenDataLab/MinerU Magic-PDF 简介 Magic-PDF 是一款将 PDF 安装magic-pdf conda create -n MinerU python=3.10 conda activate MinerU pip install -U magic-pdf[full] - 存放图片目录 ├── some_pdf_layout.pdf # layout 绘图 ├── some_pdf_middle.json # minerU
3.5K10编辑于 2024-11-24
来自专栏周拱壹卒
内网环境在 RAGFlow 中使用 MinerU
本文可作为使用教程：如何在 RAGFlow 中使用 MinerU[1] 的补充，介绍如何在内网环境下配置 MinerU 解析器以供 RAGFlow 使用。： MINERU_EXECUTABLE=/ragflow/uv_tools/.venv/bin/mineru MINERU_MODEL_SOURCE=local 其中 MINERU_MODEL_SOURCE 注意需保持 USER_MINERU=false，若设为 true，启动容器时会自动执行 MinerU 的安装，在内网环境不适用。创建 mineru.json 根据 MinerU 配置模板[4] 或下面内容，创建 mineru.json 配置文件，放在 volume 路径下供后面 docker-compose.yml 中使用： { /volume/mineru.json:/root/mineru.json + - .
1K10编辑于 2026-03-16
MinerU 生态实战_图片型PDF批量转Markdown
好消息是 MinerU 现在开放了完整的开发者生态（mineru.net/ecosystem），涵盖 Python / Go / TypeScript SDK、CLI、LangChain / LlamaIndex 批量处理：题主要的「能批量跑」import osfrom mineru import MinerUclient = MinerU()pdf_dir = "/path/to/pdfs"for fname Token 在 mineru.net/apiManage/token 免费申请，支持最大 200MB / 200 页：from mineru import MinerUclient = MinerU(" 相关链接MinerU 生态主页：mineru.net/ecosystemPython SDK：GitHubCLI 工具：GitHubAPI Token 申请：mineru.net/apiManage/tokenAPI 文档：mineru.net/apiManage/docs
39110编辑于 2026-04-16
MinerU JSTS SDK 深度指南：JavaScriptTypeScript 开发者的 PDF文档解析利器
MinerU 是什么MinerU 是上海人工智能实验室开源的一站式文档解析工具，基于视觉语言模型（VLM）架构，能够将 PDF、图片、Word、PPT、Excel 等任意格式的文档转换为结构化的 Markdown token：import { MinerU } from "mineru-open-sdk";const client = new MinerU(); // 自动读取 MINERU_TOKEN方式二：代码中显式传入import { MinerU } from "mineru-open-sdk";const client = new MinerU("your-api-token");如果没有传入 token import { MinerU } from "mineru-open-sdk";const client = new MinerU();const result = await client.flashExtract import { MinerU } from "mineru-open-sdk";const client = new MinerU("your-api-token");const result = await
50111编辑于 2026-04-14
来自专栏轩辕镜像
MinerU Docker 部署指南：PDF 结构化解析服务实践
查看可用镜像标签如需指定特定版本的MinerU镜像，可访问MinerU镜像标签列表（轩辕）https://xuanyuan.cloud/r/alexsuntop/mineru/tags查看所有可用标签。接口，方便其他应用程序集成MinerU的文档处理能力。 :&mineru-vllm<<:*defaultimage:xxx.xuanyuan.run/alexsuntop/mineru:latestenvironment:MINERU_MODEL_SOURCE #显存不足时可调整mineru-api:<<:*mineru-vllmcontainer_name:mineru-apiprofiles:["api"]ports:-8000:8000entrypoint #显存不足时可调整mineru-gradio:<<:*mineru-vllmcontainer_name:mineru-gradioprofiles:["gradio"]ports:-7860:7860entrypoint
3K20编辑于 2025-12-31
MinerU + RAG 集成实战：从 PDF 结构化解析到精准检索
MinerU + RAG 集成实战：从 PDF 结构化解析到精准检索0. MinerU 在 RAG 链路里扮演什么角色MinerU 是上海人工智能实验室（OpenDataLab）开源的文档解析平台，核心能力是将 PDF、Word、PPT、图片等非结构化文档转换为结构化结果，输出安装后验证：python -c "from langchain_mineru import MinerULoader; print('OK')"2.2 端到端脚本# mineru_demo.py — 用一份 PDF 跑通 MinerU → FAISS 全链路from langchain_mineru import MinerULoaderfrom langchain_text_splitters import 生产落地的三个坑把 MinerU 集成到生产 RAG pipeline 中，有几个实际问题值得注意。
38210编辑于 2026-04-29
来自专栏四楼没电梯
字节跳动 Dolphin vs Mineru：哪个才是你的文档解析最优解？
这篇文章将带你快速搞清楚：它们分别是什么，有什么特点；哪些功能适合研究，哪些更适合实际应用； Dolphin 和 Mineru，谁才是你的菜？一句话总结 Dolphin 更适合研究和多模态文档解析，Mineru 更适合实际生产和多类型文档处理。快速对比：Dolphin vs Mineru 对比维度 Dolphin Mineru 发布机构字节跳动 Bytedance 上海人工智能实验室 OpenDataLab 发布时间 2025 年 5 MinerU 使用文档：MinerU 文档中心适用场景各类生产环境文档自动化处理 OCR 文档、合同扫描件、旧档案清洗 NLP 项目数据预处理和知识库构建性能实测亮点 Dolphin 页面级是研究人员 / 算法工程师主要文档是学术论文、技术文档对效率和多模态理解有强需求 ️ 你适合 Mineru 吗？
4.1K10编辑于 2025-05-29
MinerU 2.5-Pro 正式上线 SaaS 端，解锁 Office 全能解析新战力
在线版完成最新模型适配4月底，MinerU3.0/3.1系列开源项目已经支持MinerU2.5-Pro模型本地部署使用。（点击了解：干货满满丨MinerU3.0系列更新：一次不止于模型的全面进化）最新的MinerUSaaS端（客户端、网页端、API）也完成了MinerU2.5-Pro模型的适配，不用下载，不用部署，不用配环境立即体验MinerU：https://mineru.net/三、MinerU2.5-Pro能力展示1.2B参数，不改模型结构，只换数据。 MinerU2.5-Pro模型在OmniDocBenchv1.6评测集上综合跑出95.69分，力压各类模型，登顶文档解析SOTA，着实亮眼。打开MinerU，上传你最棘手的那份文档，看看SOTA级别的解析到底长什么样。立即体验MinerU：https://mineru.net/
29710编辑于 2026-05-15
MinerU LangChain 集成深度指南：一行代码搞定 PDF 到 RAG
MinerU 是什么MinerU 是上海人工智能实验室开源的一站式文档解析工具，基于视觉语言模型（VLM）架构，能够将 PDF、图片、Word、PPT、Excel 等任意格式的文档转换为结构化的 Markdown langchain-mineru 是 MinerU 官方维护的 LangChain 文档加载器（Document Loader）。如需图片/JSON/DOCX/HTML/LaTeX 等多元输出，请使用 MinerU Python SDK。 Precision 模式 Token 申请Token 可在 MinerU API 管理平台免费申请。 /MinerU-Ecosystem/tree/main/sdk/pythonAPI 文档：https://mineru.net/apiManage/docsToken 申请：https://mineru.net
55610编辑于 2026-04-16
Vibe Coding 老翻车？可能是你的 AI 根本读不懂产品文档
解法：为你的 AI 接入 MinerU MCP Server解决办法也极度自然：给你的开发平台（比如 Antigravity 或支持 MCP 的编辑器）配置 MinerU 的 MCP Server。第一步：获取免费 Token首次使用需要前往 MinerU 官网获取专属 API Token（第一次需要注册登录）：直接访问MinerU 官网申请即可获取。核心配置如下：服务器类型：command (即 stdio 标准流模式)执行命令 (Command)：uvx运行参数 (args)：["mineru-open-mcp"]环境变量 (Env)：设定 MINERU_API_TOKEN ": { "command": "uvx", "args": "mineru-open-mcp", "env": { "MINERU_API_TOKEN": 点击 + Add New MCP Server，名称填入 mineru，类型对应选择 command，输入 uvx mineru-open-mcp 作为完整命令（视界面可能要分开填参）。
28700编辑于 2026-04-09
来自专栏AI进修生
MinerU、Doc2X、OmniParse、llm_aided_ocr 四款流行OCR工具测评（LLM & RAG数据准备）
我部署实操了下面这几个近期流行的LLM OCR工具： MinerU MinerU曾在一两周前上过Github Trending榜，并且持续了好几天。并且MinerU不能像Doc2X那样把表格图表OCR出来转为html、markdown表格这些结构化数据，它仅仅截图保存在本地。但是Doc2X可以很好的识别出来：不过MinerU在公式识别上还不错，至少不会像OmniParse那样将原字符识别错误。要在本地部署他大约需要8G显存，如果你用cpu的话它将变得非常慢。总的来说，我会使用Doc2X去完成我的工作，MinerU可以期待它接下来的更新，llm_aided_ocr可能需要我们进一步自己完善，OmniParse也是一个不错的项目，我挺欣赏他的多媒体形式文件支持的 Doc2X官网 https://doc2x.noedgeai.com/ 参考链接： [1] MinerU：https://github.com/opendatalab/MinerU [2] omniparse
8.6K10编辑于 2024-12-02
来自专栏Dotnet Dancer
MinerU本地化部署教程——一款AI知识库建站的必备工具
前言：来一个官方一点的介绍：MinerU是一个一站式、开源、高质量的数据提取工具，支持多种功能，如提取 PDF、markdown 等格式的内容。 MinerU可以用来做什么？下载minerU，客户端版本下载地址： https://mineru.net/ 安装完成以后，可以直接上传文件进行解析。注意，这儿上传的文件，会被传输到远程的线上默认环境进行解析。但是使用客户端的minerU,毕竟文档会被上传到云端，如果遇到私密的文档，还可能存在消息泄露的隐患。所以需要本地化部署minerU来解决这个问题，毕竟本地才最安全。接下来开始本地化部署操作教程。 conda create -n mineru python=3.10 创建成功以后，激活conda环境。 conda activate mineru 安装magic-pdf环境，主要解析工具是这个。以上就是minerU本地安装配置的全部过程。没了。
13.9K10编辑于 2025-03-29
MinerU LlamaIndex 集成深度指南：一键打通复杂文档与大模型数据索引架构
MinerU 是什么MinerU 是上海人工智能实验室开源的一站式文档解析工具，基于视觉语言模型（VLM）架构，能够将 PDF、图片、Word、PPT、Excel 等任意格式的文档转换为结构化的 Markdown llama-index-readers-mineru 是 MinerU 官方维护的 LlamaIndex 连接器。或使用 uv：uv add llama-index-readers-mineru快速上手一行代码加载 PDFfrom llama_index.readers.mineru import MinerUReaderreader 返回的原始文件名.metadata["loader"]固定为 "mineru"相关链接MinerU 官网：https://mineru.netLlamaIndex 官网：https://www.llamaindex.aiMinerU Python SDK：https://github.com/opendatalab/MinerU-Ecosystem/tree/main/sdk/pythonAPI 文档：https://mineru.net
53610编辑于 2026-04-16
干货满满丨MinerU 3.0 系列更新：一次不止于模型的全面进化
随着MinerU2.5-Pro模型在OmniDocBench1.6上取得SOTA成绩的发布，大家都在询问我们：MinerU开源项目什么时候能真正把这个超强模型接进来，跑在实际的文档解析项目里？好消息：最新发布的MinerU3.1.0开源项目已经完成了对MinerU2.5-Pro模型的适配，正式发布！ ●MinerU开源模型获取地址：**https://github.com/opendatalab/MinerU**●HuggingFacedemo体验入口：**https://huggingface.co 如果大家希望感受MinerU2.5-Pro模型的强悍转化能力，欢迎访问在线demo进行体验：●MinerU开源模型获取地址：https://github.com/opendatalab/MinerU●HuggingFacedemo /OpenDataLab/MinerU2.5-Pro-2604-1.2B*MinerU线上服务正在快马加鞭适配中，敬请期待！
48510编辑于 2026-04-30
来自专栏《Cloud Studio》
免费部署PDF转Markdown文件的方法
MinerU关于PDF转Markdown的工具，一个比较不错的工具是MinerU，这是一个开源免费的转换工具。 Github地址是：https://github.com/opendatalab/MinerU，同时也给了官网Demo地址：https://mineru.net/，在官网Demo地址上同样可以免费体验，一般来说，这种PDF转换工具，对硬件的要求都比较高，比如MinerU就给出了推荐的硬件配置，其中内存建议32G以上。为了更好的体验MinerU的功能，我们选择云服务器来部署。由于MinerU只用CPU也可以正常运行，所以我们选择左侧的通用工作空间就可以。安装magic-pdfconda create -n mineru python=3.10conda activate minerupip install -U "magic-pdf[full]" --
1.6K00编辑于 2025-03-13
来自专栏翩翩白衣少年
开源的全能Markdown格式文件提取器：MinerU
大家好，今天要给大家推荐一款堪称全能的开源Markdown格式文件提取器—MinerU。 MinerU项目介绍 MinerU 是一款一站式的高质量数据提取工具，主要功能包括从PDF、网页和电子书中提取数据，并将其转换为Markdown格式。无论是处理繁琐的PDF文档，还是从网页和电子书中提取有价值的信息，MinerU都能够轻松应对。该项目采用PyMuPDF以实现高级功能。结语总的来说，MinerU是一款非常实用且强大的数据提取工具。无论你是开发者、互联网从业者，还是有具体需求的新人小白，MinerU都能极大地提升你的工作效率，让你专注于更有价值的工作。最后，如果你对MinerU感兴趣，不妨亲自尝试一下，相信你会爱上这款全能的Markdown格式文件提取器。
2.3K10编辑于 2024-08-13
来自专栏翩翩白衣少年
开源本地文档翻译神器，完美保留原格式，还能自动生成术语表（带一键安装包）
注意： DocuTranslate: 标准版，使用在线的 minerU 引擎解析PDF文档，如果不需要本地解析pdf选这个版本（推荐）。 import MarkdownBasedWorkflow, MarkdownBasedWorkflowConfig from docutranslate.converter.x2md.converter_mineru 构建转换器配置 (使用 minerU) converter_config = ConverterMineruConfig( mineru_token="YOUR_MINERU_TOKEN ", # 你的 minerU Token formula_ocr=True # 开启公式识别 ) # 3. 构建主工作流配置 workflow_config = MarkdownBasedWorkflowConfig( convert_engine="mineru", # 指定解析引擎
97310编辑于 2026-03-16

第 2 页第 3 页第 4 页

点击加载更多

基于MinerU的PDF解析API

MinerU的python接口使用例子

国产开源的文档转换器:MinerU

MinerU、Magic-PDF、Magic-Doc

内网环境在 RAGFlow 中使用 MinerU

MinerU 生态实战_图片型PDF批量转Markdown

MinerU JSTS SDK 深度指南：JavaScriptTypeScript 开发者的 PDF文档解析利器

MinerU Docker 部署指南：PDF 结构化解析服务实践

MinerU + RAG 集成实战：从 PDF 结构化解析到精准检索

字节跳动 Dolphin vs Mineru：哪个才是你的文档解析最优解？

MinerU 2.5-Pro 正式上线 SaaS 端，解锁 Office 全能解析新战力

MinerU LangChain 集成深度指南：一行代码搞定 PDF 到 RAG

Vibe Coding 老翻车？可能是你的 AI 根本读不懂产品文档

MinerU、Doc2X、OmniParse、llm_aided_ocr 四款流行OCR工具测评（LLM & RAG数据准备）

MinerU本地化部署教程——一款AI知识库建站的必备工具

MinerU LlamaIndex 集成深度指南：一键打通复杂文档与大模型数据索引架构

干货满满丨MinerU 3.0 系列更新：一次不止于模型的全面进化

免费部署PDF转Markdown文件的方法

开源的全能Markdown格式文件提取器：MinerU

开源本地文档翻译神器，完美保留原格式，还能自动生成术语表（带一键安装包）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐