首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >里程碑更新!CUDA 13.3 补齐C++/Python生态,硬核赋能底层算力开发

里程碑更新!CUDA 13.3 补齐C++/Python生态,硬核赋能底层算力开发

作者头像
GPUS Lady
发布2026-06-01 14:58:01
发布2026-06-01 14:58:01
1700
举报
文章被收录于专栏:GPUS开发者GPUS开发者

NVIDIA 正式推出CUDA 13.3版本更新,本次升级聚焦底层GPU开发场景,面向深耕硬件底层开发的开发者带来多项核心功能迭代与体验革新,大幅优化底层并行计算开发能力、适配性与工程落地稳定性,全方位提升GPU开发工作流效率。

本次更新中,CUDA Tile 模块迎来重大版本升级,是底层开发能力提升的核心亮点。新版本全面适配Hopper架构,同时拓宽了Ampere及以上架构的兼容覆盖范围,完美适配更多主流GPU硬件设备。在算力运算层面,升级支持规模化矩阵乘法(scaled MMA)运算,大幅提升大规模并行矩阵计算的性能与效率。同时,新增4位数据类型支持,进一步优化数据存储与传输效率,降低轻量化算力开发的资源开销。除此之外,CUDA Tile 还新增跨步视图、聚集/分散视图等多项实用功能,丰富了底层数据读写与调度方式,让开发者能够更灵活地操控GPU底层数据,适配更多复杂的算力开发场景。

相较于模块功能迭代,本次更新带来了更具突破性的开发流程革新——CUDA Tile C++ 正式上线。该功能彻底打通Tile编程与原生CUDA C++开发体系,开发者无需切换全新开发框架,即可在日常使用的CUDA C++工作流中直接开展Tile编程开发,大幅降低了高性能底层GPU编程的学习成本与迁移成本,让精细化、高性能的Tile并行开发模式得以快速落地复用。

在Python生态适配方面,CUDA Python 正式迭代至1.0稳定版本,迎来里程碑式升级。核心组件 cuda.core 现已完成稳定性打磨,正式纳入语义化版本(SemVer)管理体系。这一升级意味着CUDA Python 底层基础彻底成熟、可控可迭代,为开发者搭建高性能、高可靠的GPU加速Python系统筑牢底层根基,有效解决了旧版本兼容性不稳定、版本迭代混乱、工程落地风险高等痛点,助力Python生态下的AI算力加速、科学计算、大数据处理等场景规模化落地。

除核心重磅更新外,CUDA 13.3 还带来了全方位的配套能力升级与优化。编译器层面,nvcc与NVRTC工具正式支持C++23最新语法标准,跟进主流C++开发生态,满足现代化高性能代码的编译开发需求;新增CompileIQ/ACF编译器控制工作流,赋予开发者更精细化的编译调控能力,可针对性优化编译效率与程序运行性能。同时,本次版本同步完成了开发工具功能迭代、官方算法库性能优化,并且修复了大量历史已知问题,全面提升CUDA开发环境的稳定性、兼容性与实用性。

整体而言,CUDA 13.3 围绕底层硬件操控、跨语言开发、编译优化、生态稳定四大核心维度完成全面升级,既深耕专业底层GPU开发场景,兼顾高性能、精细化开发需求,又优化了Python、C++主流开发生态,为不同技术栈的GPU开发者提供更高效、稳定、灵活的开发解决方案。

更多信息访问:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档