CUDA在处理图像一般都选用二维的线程,这样像素就可以和坐标一一对应上,但是我想把这些数存在共享内存中,共享内存怎么声明成2维的,网上没找到相关的链接,不知道是不是关键字搜的不对。用的是CUDA4.0。或者怎样能更快的并行处理数据