首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏GPUS开发者

    统一CUDA Python 生态系统

    以字串形式建构装置程式码,并使用CUDA C++ 执行阶段编译函式库NVRTC进行编译。 = nvrtc.nvrtcResult.NVRTC_SUCCESS: raise RuntimeError("Nvrtc Error: {}".format(err)) else 之后使用NVRTC 编译字串。这是CUDA Python 中唯一需要理解CUDA C++ 的部分。 请记住,这是使用NVRTC,在执行阶段执行。NVRTC 有三个基本步骤: 从字串建立程式。 编译程式。 从已编译程式中撷取PTX。 在建立context之后,可以继续使用NVRTC 编译CUDA 核心。

    1.5K20编辑于 2022-03-04
  • 来自专栏专栏名称都被占用了

    TKE集群ubuntu 16.04节点更新GPU驱动和CUDA Toolkit

    -10-0 10.0.130-1 amd64 NVRTC native amd64 NVRTC native dev links, headers ii cuda-nvtx-10-0 10.0.130 amd64 NVRTC native runtime libraries ii cuda-nvrtc-dev-10-0 10.0.130 -1 amd64 NVRTC native dev links, headers ii cuda-nvrtc-dev-10-2 10.2.89-1 amd64 NVRTC native dev

    1.9K30发布于 2021-07-19
  • 来自专栏AI SPPECH

    27:【PyTorch】nvidia / triton依赖没装(2.6+版本常见)

    依赖名称 版本要求 作用 安装命令 nvidia-cublas-cu13 13.1.0.3 CUDA基础线性代数库 pip install nvidia-cublas-cu13 nvidia-cuda-nvrtc-cu13 13.1.0.3 CUDA运行时编译库 pip install nvidia-cuda-nvrtc-cu13 nvidia-cuda-runtime-cu13 13.1.0.3 CUDA运行时库 pip install triton 3.3 解决方案详解 3.3.1 安装nvidia依赖 # 方法1:使用pip安装 pip install nvidia-cublas-cu13 nvidia-cuda-nvrtc-cu13 nvidia-cuda-runtime-cu13 nvidia-cudnn-cu13 # 方法2:使用uv安装(推荐) uv pip install nvidia-cublas-cu13 nvidia-cuda-nvrtc-cu13 check_nvidia_deps() required_nvidia_deps = [ "nvidia-cublas-cu13", "nvidia-cuda-nvrtc-cu13

    40710编辑于 2026-02-23
  • [ubuntu]卸载ubuntu18.04显卡驱动报错cuda-libraries-11-4 : Depends: cuda-cudart-11-4

    Depends: cuda-cudart-11-4 (>= 11.4.148) but 11.4.43-1 is installed                        Depends: cuda-nvrtc

    18300编辑于 2025-07-19
  • 来自专栏小陈运维

    人工智能NVIDIA显卡计算(CUDA+CUDNN)平台搭建

    正在选中未选择的软件包 cuda-nvrtc-11-3。 准备解压 .../04-cuda-nvrtc-11-3_11.3.109-1_amd64.deb ... 正在解压 cuda-nvrtc-11-3 (11.3.109-1) ... 正在选中未选择的软件包 libcublas-11-3。 正在选中未选择的软件包 cuda-nvrtc-dev-11-3。 准备解压 .../26-cuda-nvrtc-dev-11-3_11.3.109-1_amd64.deb ... 正在解压 cuda-nvrtc-dev-11-3 (11.3.109-1) ... 正在选中未选择的软件包 libcublas-dev-11-3。 正在设置 cuda-nvrtc-11-3 (11.3.109-1) ... 正在设置 cuda-sanitizer-11-3 (11.3.111-1) ...

    1.8K20发布于 2021-10-13
  • 来自专栏AI科技大本营的专栏

    推荐 | 机器学习开源项目 Top 10

    张量生成式(简称TC)是一个多功能的C++库,利用Halide、ISL、NVRTC和LLVM框架,它能够自动合成高性能的机器学习内核。

    74180发布于 2018-04-26
  • 来自专栏软件研发

    讲解device:GPU:0 but available devices are [ /job:localhost/replica:0/task:0/dev

    NVRTC(NVIDIA Runtime Compilation):这是一个用于在运行时编译CUDA代码的库。 NVRTC库允许开发人员将CUDA C/C++代码作为字符串传递给库函数,并在运行时将其编译为可执行的CUDA代码,从而实现动态生成和执行CUDA代码的能力。

    1.5K10编辑于 2023-12-18
  • 来自专栏目标检测和深度学习

    推荐 | 机器学习开源项目 Top 10

    张量生成式(简称TC)是一个多功能的C++库,利用Halide、ISL、NVRTC和LLVM框架,它能够自动合成高性能的机器学习内核。

    1.8K20编辑于 2022-03-04
  • 来自专栏往期博文

    【C++】VS配置OpenCV/Libtorch环境

    \lib 3.在依赖项添加以下内容(Libtorch文件夹下的一些lib文件,不同版本的Libtorch会略有区别) asmjit.lib c10.lib c10_cuda.lib caffe2_nvrtc.lib

    1.3K30编辑于 2023-09-02
  • 来自专栏AI科技大本营的专栏

    资源 | 机器学习十大热文新鲜出炉,这个月你该读哪篇?

    Tensor Comprehensions是一个多功能的C++库,利用Halide、ISL、NVRTC和LLVM框架,它能够自动合成高性能的机器学习内核。

    91240发布于 2018-04-26
  • 来自专栏GPUS开发者

    NVIDIA CUDA 13.2 发布:性能跃升与生态完善的双重突破

    cuFFT 库则明确了链接时优化(LTO)内核对 NVRTC 的依赖,为后续性能优化奠定基础。

    50010编辑于 2026-03-27
  • 来自专栏开源技术小栈

    PHP快速入门开源大模型平台魔塔ModelScope

    networkx-3.1 numpy-1.24.4 nvidia-cublas-cu12-12.1.3.1 nvidia-cuda-cupti-cu12-12.1.105 nvidia-cuda-nvrtc-cu12

    1.7K10编辑于 2024-01-23
  • 来自专栏大数据生态

    「最佳实践」腾讯云 Elasticsearch 8 向量化语义检索:使用自建 GPU 机器学习节点进行高效推理

    nltk==3.8.1 numpy==1.26.3 nvidia-cublas-cu12==12.1.3.1 nvidia-cuda-cupti-cu12==12.1.105 nvidia-cuda-nvrtc-cu12

    3.4K7770编辑于 2024-03-11
  • 来自专栏大数据生态

    「最佳实践」腾讯云 ES 8 向量化语义混合检索测试指南

    nltk==3.8.1 numpy==1.26.3 nvidia-cublas-cu12==12.1.3.1 nvidia-cuda-cupti-cu12==12.1.105 nvidia-cuda-nvrtc-cu12

    1.3K4038编辑于 2024-04-11
  • 来自专栏AI智韵

    EfficientVMamba实战:使用EfficientVMamba实现图像分类任务(一)

    1.11.1.1 numpy==1.26.2 # nvidia-cublas-cu12==12.1.3.1 # nvidia-cuda-cupti-cu12==12.1.105 # nvidia-cuda-nvrtc-cu12

    41210编辑于 2024-10-22
  • 第七章:CPU与GPU计算引擎实现

    ;" + " }" + "}"; // 编译CUDA代码 try { // 这里应该使用NVRTC

    24110编辑于 2025-08-06
  • 来自专栏开源技术小栈

    PHP使用简单强大OCR工具EasyOCR

    python3.10/site-packages (from torch->easyocr) (2024.2.0) Requirement already satisfied: nvidia-cuda-nvrtc-cu12

    1.6K10编辑于 2024-09-10
  • 来自专栏Hadoop实操

    如何在CDSW中使用GPU运行深度学习

    8-0=$CUDA_VERSION-1 RUN apt-get update && apt-get install -y --no-install-recommends \ cuda-nvrtc

    2.2K20发布于 2018-07-12
  • 来自专栏AI科技评论

    JIT in MegEngine:旷视工程师为你解密天元背后的技术

    当前天元支持三种 JIT 编译器后端,分别是 NVRTC(支持英伟达 GPU),Halide 和 MLIR。

    96120发布于 2021-03-24
  • 来自专栏AutoML(自动机器学习)

    显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么?

    cudadevrt: CUDA device runtime cupti: CUDA profiling tools interface nvml: NVIDIA management library nvrtc

    4.6K31发布于 2020-06-12
领券