文章/答案/技术大牛

发布

社区首页 >问答首页 >封装静态2D对象的CUDA结构

问封装静态2D对象的CUDA结构
EN

Stack Overflow用户

提问于 2013-09-30 20:48:05

回答 1查看 101关注 0票数 0

当我创建一个具有3深度结构的结构，而最深层有一个2个小数组时，在设备上分配内存并访问该数组会在使用CUDA调试器时导致内存检查器访问冲突错误。下面是一个示例：

#include "stdafx.h"

#include <stdio.h>
#include <cuda.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>

typedef struct {
    int value;
} Level3;

typedef struct {
    Level3 lvl3ObjArr[10][10];
} Level2;

typedef struct {
    Level2 lvl2Obj;
} Level1;

__global__ void AccessViolationKernel(Level1 *_lvl1Ptr)
{
    int _value;

    _lvl1Ptr->lvl2Obj.lvl3ObjArr[2][5].value = 4;
    _value = _lvl1Ptr->lvl2Obj.lvl3ObjArr[2][5].value;

    printf("Value = %i\n", _value);
}

int _tmain(int argc, _TCHAR* argv[])
{
    Level1 *lvl1Ptr;
    cudaMalloc((void **)&lvl1Ptr, sizeof(Level1));
    AccessViolationKernel<<<5, 1>>>(lvl1Ptr);

    return 0;
}

即使查看内存并添加正确的字节，在使用CUDA调试器时，lvl1Ptr对lvl3ObjArr2的封装引用似乎都是正确的。但是，访问的数据是不正确的，并且mem凭据引发了访问冲突。

设备上没有正确分配Level1吗？为什么我要违反访问权限？

提前感谢！

-更新(2013年9月30日下午16:29科技委) --

此代码编译(对不起！)但它并没有显示出错误。我认为这是因为我使用的不是cudaMalloc，而是使用了设备cudaMalloc，并试图稍后从主机的CUDA中访问数据。我需要一段时间才能生成代码，我很抱歉--我减少的源代码有2800行长。

arrays

struct

cuda

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-10-07 14:58:51

好了找到解决办法了。我在内核中将cudaMalloc和malloc/free混合在一起。这是不直观的，因为我用cudaMalloc分配根，稍后再用malloc在设备上分配它。一些对象仍然是通过封装从主机分配的，因此设备堆在访问期间不知道，并且会引发访问冲突。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/19103532

复制

相似问题

问封装静态2D对象的CUDA结构
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问封装静态2D对象的CUDA结构EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问封装静态2D对象的CUDA结构
EN