环境:win7_64 VS2013 CUDA7.0 

安装配置CUDA环境,这里就不详细介绍了。

一、手动建立CUDA工程

  1. 打开VS2013,新建空白项目,起名为 test2。 
  2. 在解决方案管理器中,右键点击工程test2,生成自定义,选择CUDA6.0
  3. 添加头文件 t.h,注意这里t.cuh,也是可以的,但是为了外观上等同于纯C\C++类库,写成.h
  4. 添加源文件 t.cu ,右键点击t.cu,属性,常规,项类型,选择CUDA C/C++。
  5. 检查链接器->常规->附加库目录  中,有没有继承$(CudaToolkitLibDir),没有的话要添加进去
  6. 在链接器->输入->附加依赖项 中 ,添加cudart_static.lib
  7. 这样一个手动建立的CUDA工程就配置好了。

二、建立CUDA类库,并生成dll

  1. 在t.h中,写上函数声明,包含两类函数,一是KERNEL函数,使用GPU的并行计算;二是调用KERNEL函数的普通C函数。这两类函数必须放到cu文件中,由CUDA编译器编译,内容如下:
#ifndef _TEST2_H
#define _TEST2_H//防御重复编译
#ifdef _DLLEXPORTING//dll到处符号宏定义
#define TEST2_DLLDECL __declspec(dllexport)
#else
#define TEST2_DLLDECL __declspec(dllimport)
#endif
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
//这两个头文件是CUDA必备,但是你右键->打开文档“”的时候VS却不能找到。不需要你手动设置路径,只需要在 右键工程->生成自定义 中,选择CUDA,VS即可自动找到包含路径
#include <stdio.h>
__global__ void addKernel(int *c, const int *a, const int *b);//这个是KERNEL函数,不能作为类库外部接口
cudaError_t TEST2_DLLDECL  addWithCuda(int *c, const int *a, const int *b, unsigned int size);//这个C函数,内部调用了KERNEL函数,只能放在cu文件中,使用CUDA编译器编译。使用__declspec(dllimport)调用声明,作为dll的接口供外部调用。

    2.在t.cu中写入两个函数的实现,如下(可以参考http://blog.csdn.net/augusdi/article/details/12833235):

#include "t.h"
__global__ void addKernel(int *c, const int *a, const int *b)
{
    int i = threadIdx.x;
    c[i] = a[i] + b[i];
}
cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size)
{
 //其他代码省略
        addKernel<<<1, size>>>(dev_c, dev_a, dev_b);
        //其他代码省略
 return cudaStatus;
}

    3.工程属性,CUDA C\C++中,选择Host ,Proprocessor Definition 中,添加_DLLEXPORTING

    4.在工程属性中,设置生成目标为DLL,这样会生成,dll,lib,pdb,等几种文件