
1、编译CUDA文件,得到PTX文件。nvcc -arch=sm_20 -keep -o t266 t266cu
2、修改PTX文件
3、nvcc -dryrun -arch=sm_20 -o t266 t266cu --keep 2>dryrunout
4、把-o "t266ptx"之后的命令分步执行
5、执行
我写过一个Makefile,统一用nvcc编译和链接就可以了,nvcc是兼容gcc和g++的。具体的可以模仿Nsight的编译和链接选项,你在Nsight IDE里面build你的工程试试,terminal里面会打印出IDE的编译和链接选项的,都是用的nvcc,依葫芦画瓢搬到你的Makefile里面就行了
以上就是关于CUDA编程: *** 作PTX文件全部的内容,包括:CUDA编程: *** 作PTX文件、linux下CUDA程序一般怎么编译、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)