我正在尝试用jcuda中的共享内存做一些非常简单的事情。我的内核:
__shared__ int testMe;
extern "C"
__global__ void test() {
testMe = 5;
}将共享内存设置为全局允许我在设备功能中使用它,不幸的是,我甚至不能声明共享内存是全局的。Cuda刚刚崩溃与内核无法启动的问题。我也尝试过这样做:
extern __shared__ int test然而nvcc编译器给出的,不能外部链接共享内存的错误。我真的想让它工作起来,让编写内核变得更容易,但我看不到有什么方法。
发布于 2015-06-26 17:01:51
您不能在转换单元作用域中定义静态共享内存,必须在内核作用域中声明它。如果你这样做,你的共享内存将是同一块中的每个线程的相同内存。如果你想使用对所有块中的每个线程都相同的内存,你必须使用全局内存(在主机代码中调用cudaMalloc()并将内存的指针传递给内核)。
https://stackoverflow.com/questions/31068816
复制相似问题