CUDA从入门到放弃(二):CUDA编程环境配置
原创
©著作权归作者所有:来自51CTO博客作者mingo_敏的原创作品,请联系作者获取转载授权,否则将追究法律责任
本文环境:win7 64位 + CUDA9.0 + VS2015
1 VS2015和CUDA 9.0 安装
visual studio2015安装: 如何在visual studio2015 中配置编写C、C++程序 CUDA 9.0安装: win7 64位+CUDA 9.0+cuDNN v7.0.5 安装
2 编程环境配置
2-1 Visual Profiler
开始菜单找到Visual Profiler并打开
选定好workspace后,File->New Session,其中 File 选择要分析的.exe文件,点击Finish 开始分析;
得到我们的性能分析界面
2-2 Nsight
禁用TDR功能,
3 示例代码:获取GPU设备属性并显示
示例代码:获取GPU设备属性并显示
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include <iostream>
int main()
{
cudaError_t cudaStatus;
int nNum = 0;
cudaDeviceProp cudaProp;
// 获得可用GPU个数
cudaStatus = cudaGetDeviceCount(&nNum);
if (cudaStatus != cudaSuccess) {
fprintf(stderr, "cudaGetDeviceCount failed!");
return 1;
}
for (int i = 0; i<nNum; i++)
{
// 获得属性
cudaGetDeviceProperties(&cudaProp, i);
}
for (int j=0;j<nNum; ++j)
{
printf(" %d, name: %s, totalGlobalMem: %d (GB), sharedMemPerBlock: %d (KB), warpSize: %d, multiProcessorCount: %d, compute capability: %d.%d \n",
j,cudaProp.name,cudaProp.totalGlobalMem/1024/1024/1024, cudaProp.sharedMemPerBlock/1024, cudaProp.warpSize,
cudaProp.multiProcessorCount, cudaProp.major, cudaProp.minor);
}
getchar();
return 0;
}
输出显示:
参考资料
1 CUDA编程入门 2 Nvidia官方教程
3 CUDA编程入门极简教程
4 CUDA Toolkit Documentation v9.0.176
5 NVIDIA CUDA初级教程视频
6 CUDA专家手册 [GPU编程权威指南]
7 CUDA并行程序设计:GPU编程指南
8 CUDA C编程权威指南