首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏自然语言处理

    基于MinerU的PDF解析API

    基于MinerU的PDF解析A - MinerU的GPU镜像构建 - 基于FastAPI的PDF解析接口 支持一键启动,已经打包到镜像中,自带模型权重,支持GPU推理加速,GPU速度相比CPU每页解析要快几十倍不等 进行表格识别; 光学字符识别:使用PaddleOCR进行文本识别; 镜像地址: 阿里云地址:docker pull registry.cn-beijing.aliyuncs.com/quincyqiang/mineru :0.2-models dockerhub地址:docker pull quincyqiang/mineru:0.2-models 启动命令: docker run -itd --name=mineru_server --gpus=all -p 8888:8000 quincyqiang/mineru:0.2-models 具体截图请见博客:https://cloud.tencent.com/developer/article

    2.7K11编辑于 2024-11-23
  • MinerU的python接口使用例子

    参考官方例子:mineru.readthedocs.io/en/latest/user_guide/quick_start/to_markdown.html 本地文件例子: import os from

    86910编辑于 2025-07-22
  • 来自专栏姓王者的博客

    国产开源的文档转换器:MinerU

    简介 MinerU是由OpenDataLab团队打造的大模型时代的文档提取/转换神器 支持PDF、Word、PPT等多种文档的智能解析,可用于机器学习、大模型语料生产、RAG等场景 特点 多语种支持 多类型支持

    98010编辑于 2025-03-28
  • 来自专栏python前行者

    MinerU、Magic-PDF、Magic-Doc

    关于 MinerU MinerU 是一款一站式、开源、高质量的数据提取工具,主要包含以下功能: Magic-PDF PDF文档提取 Magic-Doc 网页与电子书提取 github: https:// github.com/opendatalab/MinerU/blob/master/README_zh-CN.md 在线体验地址: https://opendatalab.com/OpenSourceTools /Extractor/PDF https://www.modelscope.cn/studios/OpenDataLab/MinerU Magic-PDF 简介 Magic-PDF 是一款将 PDF 安装magic-pdf conda create -n MinerU python=3.10 conda activate MinerU pip install -U magic-pdf[full] - 存放图片目录 ├── some_pdf_layout.pdf # layout 绘图 ├── some_pdf_middle.json # minerU

    3.5K10编辑于 2024-11-24
  • 来自专栏周拱壹卒

    内网环境在 RAGFlow 中使用 MinerU

    本文可作为 使用教程:如何在 RAGFlow 中使用 MinerU[1] 的补充,介绍如何在内网环境下配置 MinerU 解析器以供 RAGFlow 使用。 : MINERU_EXECUTABLE=/ragflow/uv_tools/.venv/bin/mineru MINERU_MODEL_SOURCE=local 其中 MINERU_MODEL_SOURCE 注意需保持 USER_MINERU=false,若设为 true,启动容器时会自动执行 MinerU 的安装,在内网环境不适用。 创建 mineru.json 根据 MinerU 配置模板[4] 或下面内容,创建 mineru.json 配置文件,放在 volume 路径下供后面 docker-compose.yml 中使用: { /volume/mineru.json:/root/mineru.json + - .

    1K10编辑于 2026-03-16
  • MinerU 生态实战_图片型PDF批量转Markdown

    好消息是 MinerU 现在开放了完整的开发者生态(mineru.net/ecosystem),涵盖 Python / Go / TypeScript SDK、CLI、LangChain / LlamaIndex 批量处理:题主要的「能批量跑」import osfrom mineru import MinerUclient = MinerU()pdf_dir = "/path/to/pdfs"for fname Token 在 mineru.net/apiManage/token 免费申请,支持最大 200MB / 200 页:from mineru import MinerUclient = MinerU(" 相关链接MinerU 生态主页:mineru.net/ecosystemPython SDK:GitHubCLI 工具:GitHubAPI Token 申请:mineru.net/apiManage/tokenAPI 文档:mineru.net/apiManage/docs

    39110编辑于 2026-04-16
  • MinerU JSTS SDK 深度指南:JavaScriptTypeScript 开发者的 PDF文档解析利器

    MinerU 是什么MinerU 是上海人工智能实验室开源的一站式文档解析工具,基于视觉语言模型(VLM)架构,能够将 PDF、图片、Word、PPT、Excel 等任意格式的文档转换为结构化的 Markdown token:import { MinerU } from "mineru-open-sdk";const client = new MinerU(); // 自动读取 MINERU_TOKEN方式二: 代码中显式传入import { MinerU } from "mineru-open-sdk";const client = new MinerU("your-api-token");如果没有传入 token import { MinerU } from "mineru-open-sdk";const client = new MinerU();const result = await client.flashExtract import { MinerU } from "mineru-open-sdk";const client = new MinerU("your-api-token");const result = await

    50111编辑于 2026-04-14
  • 来自专栏轩辕镜像

    MinerU Docker 部署指南:PDF 结构化解析服务实践

    查看可用镜像标签如需指定特定版本的MinerU镜像,可访问MinerU镜像标签列表(轩辕)https://xuanyuan.cloud/r/alexsuntop/mineru/tags查看所有可用标签。 接口,方便其他应用程序集成MinerU的文档处理能力。 :&mineru-vllm<<:*defaultimage:xxx.xuanyuan.run/alexsuntop/mineru:latestenvironment:MINERU_MODEL_SOURCE #显存不足时可调整mineru-api:<<:*mineru-vllmcontainer_name:mineru-apiprofiles:["api"]ports:-8000:8000entrypoint #显存不足时可调整mineru-gradio:<<:*mineru-vllmcontainer_name:mineru-gradioprofiles:["gradio"]ports:-7860:7860entrypoint

    3K20编辑于 2025-12-31
  • MinerU + RAG 集成实战:从 PDF 结构化解析到精准检索

    MinerU + RAG 集成实战:从 PDF 结构化解析到精准检索0. MinerU 在 RAG 链路里扮演什么角色MinerU 是上海人工智能实验室(OpenDataLab)开源的文档解析平台,核心能力是将 PDF、Word、PPT、图片等非结构化文档转换为结构化结果,输出 安装后验证:python -c "from langchain_mineru import MinerULoader; print('OK')"2.2 端到端脚本# mineru_demo.py — 用一份 PDF 跑通 MinerU → FAISS 全链路from langchain_mineru import MinerULoaderfrom langchain_text_splitters import 生产落地的三个坑把 MinerU 集成到生产 RAG pipeline 中,有几个实际问题值得注意。

    38210编辑于 2026-04-29
  • 来自专栏四楼没电梯

    字节跳动 Dolphin vs Mineru:哪个才是你的文档解析最优解?

    这篇文章将带你快速搞清楚: 它们分别是什么,有什么特点; 哪些功能适合研究,哪些更适合实际应用; Dolphin 和 Mineru,谁才是你的菜? 一句话总结 Dolphin 更适合研究和多模态文档解析,Mineru 更适合实际生产和多类型文档处理。 快速对比:Dolphin vs Mineru 对比维度 Dolphin Mineru 发布机构 字节跳动 Bytedance 上海人工智能实验室 OpenDataLab 发布时间 2025 年 5 MinerU 使用文档:MinerU 文档中心 适用场景 各类生产环境文档自动化处理 OCR 文档、合同扫描件、旧档案清洗 NLP 项目数据预处理和知识库构建 性能实测亮点 Dolphin 页面级 是研究人员 / 算法工程师 主要文档是学术论文、技术文档 对效率和多模态理解有强需求 ️ 你适合 Mineru 吗?

    4.1K10编辑于 2025-05-29
  • MinerU 2.5-Pro 正式上线 SaaS 端,解锁 Office 全能解析新战力

    在线版完成最新模型适配4月底,MinerU3.0/3.1系列开源项目已经支持MinerU2.5-Pro模型本地部署使用。 (点击了解:干货满满丨MinerU3.0系列更新:一次不止于模型的全面进化)最新的MinerUSaaS端(客户端、网页端、API)也完成了MinerU2.5-Pro模型的适配,不用下载,不用部署,不用配环境 立即体验MinerU:https://mineru.net/三、MinerU2.5-Pro能力展示1.2B参数,不改模型结构,只换数据。 MinerU2.5-Pro模型在OmniDocBenchv1.6评测集上综合跑出95.69分,力压各类模型,登顶文档解析SOTA,着实亮眼。 打开MinerU,上传你最棘手的那份文档,看看SOTA级别的解析到底长什么样。立即体验MinerU:https://mineru.net/

    29710编辑于 2026-05-15
  • MinerU LangChain 集成深度指南:一行代码搞定 PDF 到 RAG

    MinerU 是什么MinerU 是上海人工智能实验室开源的一站式文档解析工具,基于视觉语言模型(VLM)架构,能够将 PDF、图片、Word、PPT、Excel 等任意格式的文档转换为结构化的 Markdown langchain-mineruMinerU 官方维护的 LangChain 文档加载器(Document Loader)。 如需图片/JSON/DOCX/HTML/LaTeX 等多元输出,请使用 MinerU Python SDK。 Precision 模式 Token 申请Token 可在 MinerU API 管理平台 免费申请。 /MinerU-Ecosystem/tree/main/sdk/pythonAPI 文档:https://mineru.net/apiManage/docsToken 申请:https://mineru.net

    55610编辑于 2026-04-16
  • Vibe Coding 老翻车?可能是你的 AI 根本读不懂产品文档

    解法:为你的 AI 接入 MinerU MCP Server解决办法也极度自然:给你的开发平台(比如 Antigravity 或支持 MCP 的编辑器)配置 MinerU 的 MCP Server。 第一步:获取免费 Token首次使用需要前往 MinerU 官网获取专属 API Token(第一次需要注册登录):直接访问MinerU 官网 申请即可获取。 核心配置如下:服务器类型:command (即 stdio 标准流模式)执行命令 (Command):uvx运行参数 (args):["mineru-open-mcp"]环境变量 (Env):设定 MINERU_API_TOKEN ": { "command": "uvx", "args": "mineru-open-mcp", "env": { "MINERU_API_TOKEN": 点击 + Add New MCP Server,名称填入 mineru,类型对应选择 command,输入 uvx mineru-open-mcp 作为完整命令(视界面可能要分开填参)。

    28700编辑于 2026-04-09
  • 来自专栏AI进修生

    MinerU、Doc2X、OmniParse、llm_aided_ocr 四款流行OCR工具测评(LLM & RAG数据准备)

    我部署实操了下面这几个近期流行的LLM OCR工具: MinerU MinerU曾在一两周前上过Github Trending榜,并且持续了好几天。 并且MinerU不能像Doc2X那样把表格图表OCR出来转为html、markdown表格这些结构化数据,它仅仅截图保存在本地。 但是Doc2X可以很好的识别出来: 不过MinerU在公式识别上还不错,至少不会像OmniParse那样将原字符识别错误。 要在本地部署他大约需要8G显存,如果你用cpu的话它将变得非常慢。 总的来说,我会使用Doc2X去完成我的工作,MinerU可以期待它接下来的更新,llm_aided_ocr可能需要我们进一步自己完善,OmniParse也是一个不错的项目,我挺欣赏他的多媒体形式文件支持的 Doc2X官网 https://doc2x.noedgeai.com/ 参考链接: [1] MinerU:https://github.com/opendatalab/MinerU [2] omniparse

    8.6K10编辑于 2024-12-02
  • 来自专栏Dotnet Dancer

    MinerU本地化部署教程——一款AI知识库建站的必备工具

    前言:来一个官方一点的介绍:MinerU是一个一站式、开源、高质量的数据提取工具,支持多种功能,如提取 PDF、markdown 等格式的内容。 MinerU可以用来做什么? 下载minerU,客户端版本下载地址: https://mineru.net/ 安装完成以后,可以直接上传文件进行解析。注意,这儿上传的文件,会被传输到远程的线上默认环境进行解析。 但是使用客户端的minerU,毕竟文档会被上传到云端,如果遇到私密的文档,还可能存在消息泄露的隐患。所以需要本地化部署minerU来解决这个问题,毕竟本地才最安全。接下来开始本地化部署操作教程。 conda create -n mineru python=3.10 创建成功以后,激活conda环境。 conda activate mineru 安装magic-pdf环境,主要解析工具是这个。 以上就是minerU本地安装配置的全部过程。没了。

    13.9K10编辑于 2025-03-29
  • MinerU LlamaIndex 集成深度指南:一键打通复杂文档与大模型数据索引架构

    MinerU 是什么MinerU 是上海人工智能实验室开源的一站式文档解析工具,基于视觉语言模型(VLM)架构,能够将 PDF、图片、Word、PPT、Excel 等任意格式的文档转换为结构化的 Markdown llama-index-readers-mineruMinerU 官方维护的 LlamaIndex 连接器。 或使用 uv:uv add llama-index-readers-mineru快速上手一行代码加载 PDFfrom llama_index.readers.mineru import MinerUReaderreader 返回的原始文件名.metadata["loader"]固定为 "mineru"相关链接MinerU 官网:https://mineru.netLlamaIndex 官网:https://www.llamaindex.aiMinerU Python SDK:https://github.com/opendatalab/MinerU-Ecosystem/tree/main/sdk/pythonAPI 文档:https://mineru.net

    53610编辑于 2026-04-16
  • 干货满满丨MinerU 3.0 系列更新:一次不止于模型的全面进化

    随着MinerU2.5-Pro模型在OmniDocBench1.6上取得SOTA成绩的发布,大家都在询问我们:MinerU开源项目什么时候能真正把这个超强模型接进来,跑在实际的文档解析项目里? 好消息:最新发布的MinerU3.1.0开源项目已经完成了对MinerU2.5-Pro模型的适配,正式发布! ●MinerU开源模型获取地址:**https://github.com/opendatalab/MinerU**●HuggingFacedemo体验入口:**https://huggingface.co 如果大家希望感受MinerU2.5-Pro模型的强悍转化能力,欢迎访问在线demo进行体验:●MinerU开源模型获取地址:https://github.com/opendatalab/MinerU●HuggingFacedemo /OpenDataLab/MinerU2.5-Pro-2604-1.2B*MinerU线上服务正在快马加鞭适配中,敬请期待!

    48510编辑于 2026-04-30
  • 来自专栏《Cloud Studio》

    免费部署PDF转Markdown文件的方法

    MinerU关于PDF转Markdown的工具,一个比较不错的工具是MinerU,这是一个开源免费的转换工具。 Github地址是:https://github.com/opendatalab/MinerU,同时也给了官网Demo地址:https://mineru.net/,在官网Demo地址上同样可以免费体验, 一般来说,这种PDF转换工具,对硬件的要求都比较高,比如MinerU就给出了推荐的硬件配置,其中内存建议32G以上。为了更好的体验MinerU的功能,我们选择云服务器来部署。 由于MinerU只用CPU也可以正常运行,所以我们选择左侧的通用工作空间就可以。 安装magic-pdfconda create -n mineru python=3.10conda activate minerupip install -U "magic-pdf[full]" --

    1.6K00编辑于 2025-03-13
  • 来自专栏翩翩白衣少年

    开源的全能Markdown格式文件提取器:MinerU

    大家好,今天要给大家推荐一款堪称全能的开源Markdown格式文件提取器—MinerUMinerU项目介绍 MinerU 是一款一站式的高质量数据提取工具,主要功能包括从PDF、网页和电子书中提取数据,并将其转换为Markdown格式。 无论是处理繁琐的PDF文档,还是从网页和电子书中提取有价值的信息,MinerU都能够轻松应对。 该项目采用PyMuPDF以实现高级功能。 结语 总的来说,MinerU是一款非常实用且强大的数据提取工具。无论你是开发者、互联网从业者,还是有具体需求的新人小白,MinerU都能极大地提升你的工作效率,让你专注于更有价值的工作。 最后,如果你对MinerU感兴趣,不妨亲自尝试一下,相信你会爱上这款全能的Markdown格式文件提取器。

    2.3K10编辑于 2024-08-13
  • 来自专栏翩翩白衣少年

    开源本地文档翻译神器,完美保留原格式,还能自动生成术语表(带一键安装包)

    注意: DocuTranslate: 标准版,使用在线的 minerU 引擎解析PDF文档,如果不需要本地解析pdf选这个版本(推荐)。 import MarkdownBasedWorkflow, MarkdownBasedWorkflowConfig from docutranslate.converter.x2md.converter_mineru 构建转换器配置 (使用 minerU) converter_config = ConverterMineruConfig( mineru_token="YOUR_MINERU_TOKEN ", # 你的 minerU Token formula_ocr=True # 开启公式识别 ) # 3. 构建主工作流配置 workflow_config = MarkdownBasedWorkflowConfig( convert_engine="mineru", # 指定解析引擎

    97310编辑于 2026-03-16
领券