记录踩过的坑-GPU
记录踩过的坑-GPU
记录踩过的坑-GPU
目录
查看GPU连续使用情况 windows
CUDA
基础信息
CUDA Scan(扫描)
computeMode
NVCC
查看GPU连续使用情况 windows
命令行模式下进入C:\Program Files\NVIDIA Corporation\NVSMI
使用: nvidia-smi.exe -l 必须是小写的l, -l 指定数字表示每个几秒刷新显示
CUDA
基础信息
CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。
显存(Global Memory):显存是在GPU板卡上的DRAM。
计算单元(Streaming Multiprocessor):执行计算的。每一个SM都有自己的控制单元(Control Unit)、寄存器(Register)、缓存(Cache)、指令流水线(execution pipelines)。
CUDA线程分成Grid和Block两个层次。
Grid:由一个单独的Kernel启动的所有线程组成一个Grid,Grid中所有线程共享显存。
一个Grid由多个Block组成。
Block:同一个Block中的线程可以同步,也可以通过shared memory通信
一个Block由多个线程组成。
Grid和Block都可以是一维、二维或者三维。
CUDA内置变量:
blockIdx:block的索引。
threadIdx:线程索引。
blockDim:block维度.
gridDim:grid维度。
Warp:A warp is a set of 32 threads within a thread block such that all the threads in a warp execute the same instruction.
CUDA Streaming Multiprocessor的基本执行单元,一个warp包含32个并行线程。每个线程块可以包含多个warp。
CUDA Scan(扫描)
求数组的前缀和(包括inclusive scan 和exclusive scan两种方式)。
假设输入数组为input,输出数组为output,那么应该有output[i] = output[i-1] + in[i];对于串行算法,时间复杂度为O(n^2),对于并行算法,又分为 Hillis and Steele scan和Blelloch scan
computeMode
computeMode is the compute mode that the device is currently in.
Available modes are as follows:
cudaComputeModeDefault: Default mode - Device is not restricted and multiple threads can use cudaSetDevice() with this device.
cudaComputeModeExclusive: Compute-exclusive mode - Only one thread will be able to use cudaSetDevice() with this device.
cudaComputeModeProhibited: Compute-prohibited mode - No threads can use cudaSetDevice() with this device. Any errors from calling cudaSetDevice() with an exclusive (and occupied) or prohibited device will only show up after a non-device management runtime function is called. At that time, cudaErrorNoDevice will be returned.
NVCC
-gencode:
arch参数是应用程序所需的最小计算体系结构,也是NVCC的JIT编译器将编译PTX代码的最小设备计算体系结构
code参数是NVCC完全编译应用程序的计算架构,因此不需要JIT编译
记录踩过的坑-GPU相关教程
-
Html5和CSS3遗漏点记录
Html5和CSS3遗漏点记录 下载Chinese,即为中文版 安装Live Server, open in browser,设置afterDelay自动保存更新网页 左下角设置,设置自动刷新时间,编辑字体大小(或Ctrl+,-) p 块元素 em 语调加重(斜体) strong 强调(加粗) blockquote 长引用 a hre
-
【开发记录】H.265编码视频播放器在播放FLV视频流时出现黑屏现象
【开发记录】H.265编码视频播放器在播放FLV视频流时出现黑屏现象如何解决? EasyPlayer是一款流媒体播放器系列项目,支持RTSP、RTMP、HTTP、HLS、UDP、RTP、File等多种流媒体协议播放、支持本地文件播放,支持本地抓拍、本地录像、播放旋转、多屏播放、倍数播
-
记录一次放弃 jqprint打印页面的过程
记录一次放弃 jqprint打印页面的过程 众所周知,当物体的速度接近光速的时候,经典力学就不成立了,同理,任何一个组件在当初被开发出来的时候,都有属于自己的应用区域,超出合理的区域,用起来就会有这种那种的问题,本次,记录一下,特定应用环境,放弃使
-
记录一次数据下载,转换、展示的过程
记录一次数据下载,转换、展示的过程 目录 数据来源 加载展示 有一天一个学长叫帮忙下载一份网上的数据,经过分析后得到数据通过当前bbox范围请求到geojson,地址如下: https://xxxxxxxx/api/layers?layer=fieldssouth=xxxnorth=xxxeast=xxxwest=xxxzoom=xx
-
训练过程可视化学习记录
训练过程可视化学习记录 这几天跑网络出现了点问题,不知道是什么原因导致网络没学到东西,学习下训练过程的可视化,这样在训练过程中可以更加直观的看出问题所在。 用的可视化库是Visdom。 1、Visdom安装 打开anaconda窗口终端,conda activate 虚拟环境名,
-
Hadoop运维记录系列(十八)
Hadoop运维记录系列(十八) 之前为了练习英语用英文写的这个博客,然后被编辑置为转载了,所以想想还是翻译过来比较好。 原文发表于 https://xianglei.tech 确实是我自己原创的。英文很烂,所以才需要练习。 使用Cloudera Manager启用Kerberos安全增强的Hadoop
-
Hadoop运维记录系列(十六)
Hadoop运维记录系列(十六) 应了一个国内某电信运营商集群恢复的事,集群故障很严重,做了HA的集群Namenode挂掉了。具体过程不详,但是从受害者的只言片语中大概回顾一下历史的片段。 Active的namenode元数据硬盘满了,满了,满了...上来第一句话就如雷贯耳。
-
php pdo怎么查询记录数据
php pdo查询记录数据的方法:可以利用fetchAll()函数来查询,如【$rows = $q-fetchAll();】。还可以利用sql count函数来查询,如【SELECT count(*) from db;】。 获取正确的SELECT结果的行数的方法 (推荐教程:php视频教程) 1、使用fetchAll函数 $q = $db-