本文环境:win7 64位 + CUDA9.0 + VS2015

1 VS2015和CUDA 9.0 安装

visual studio2015安装: ​​如何在visual studio2015 中配置编写C、C++程序​​​ CUDA 9.0安装: win7 64位+CUDA 9.0+cuDNN v7.0.5 安装

2 编程环境配置

2-1 Visual Profiler

开始菜单找到Visual Profiler并打开

CUDA从入门到放弃(二):CUDA编程环境配置_示例代码


选定好workspace后,File->New Session,其中 File 选择要分析的.exe文件,点击Finish 开始分析;

CUDA从入门到放弃(二):CUDA编程环境配置_示例代码_02


得到我们的性能分析界面

CUDA从入门到放弃(二):CUDA编程环境配置_权威指南_03

2-2 Nsight

禁用TDR功能,

CUDA从入门到放弃(二):CUDA编程环境配置_#include_04

3 示例代码:获取GPU设备属性并显示

示例代码:获取GPU设备属性并显示

#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <stdio.h>
#include <iostream>

int main()
{
cudaError_t cudaStatus;
int nNum = 0;
cudaDeviceProp cudaProp;

// 获得可用GPU个数
cudaStatus = cudaGetDeviceCount(&nNum);
if (cudaStatus != cudaSuccess) {
fprintf(stderr, "cudaGetDeviceCount failed!");
return 1;
}
for (int i = 0; i<nNum; i++)
{
// 获得属性
cudaGetDeviceProperties(&cudaProp, i);
}

for (int j=0;j<nNum; ++j)
{
printf(" %d, name: %s, totalGlobalMem: %d (GB), sharedMemPerBlock: %d (KB), warpSize: %d, multiProcessorCount: %d, compute capability: %d.%d \n",
j,cudaProp.name,cudaProp.totalGlobalMem/1024/1024/1024, cudaProp.sharedMemPerBlock/1024, cudaProp.warpSize,
cudaProp.multiProcessorCount, cudaProp.major, cudaProp.minor);
}

getchar();
return 0;
}

输出显示:

CUDA从入门到放弃(二):CUDA编程环境配置_示例代码_05


参考资料

1 ​​CUDA编程入门​​​ 2 ​​Nvidia官方教程​

3 ​​CUDA编程入门极简教程​

4 ​​CUDA Toolkit Documentation v9.0.176​

5 ​​NVIDIA CUDA初级教程视频​

6 CUDA专家手册 [GPU编程权威指南]

7 CUDA并行程序设计:GPU编程指南

8 CUDA C编程权威指南