Android GPU 使用率过高 gpu使用率为0怎么解决-zol问答
转载
对于显卡的安排与维护:
查看gpu每张卡,每个人使用的状态,使用python库的gpustat,如果没有,激活管理员权限,激活python环境后使用如下命令后输入gpustat就可以看到具体使用情况
pip install gpustat
实时刷新gpu使用情况:
watch -n 1 nvidia-smi
如果实时刷新gpu使用情况中,gpu显存占的很多,并且gpu使用率一直为0,说明可能存在僵尸进程,使用命令
fuser -v /dev/nvidia0
这里第几块卡就是写nvidia几,第1块卡就是
fuser -v /dev/nvidia1
询问使用者是否停了进程,如果停掉还占着显存说明是僵尸进程,输入如下指令将其杀死即可
kill -9 进程号
没网:
没网存在几个可能,一个是网线问题,这个直接把网线我们自己别的服务器上测试即可
排除了网线问题那就是网卡的问题,解决办法如下
ifconfig 查看网卡是否正常,若eno1,eno2消失
ifconfig eno1 up
如果网卡没有问题,那就是ip地址的设置问题,如果没有ip可以设置临时ip,不然就是常规设置ip地址的过程
用ubuntu20 netplan消失并且没法上网,设置临时 ip:
#添加临时ip
ip addr add 192.168.30.100/24 dev eno3
#添加网关
ip route add default via 网关
#up端口
ip lin set eno3 up
查看端口被监听 netstat –ntl
杀死指定端口 sudo fuser -k -n tcp 80
杀死指定用户 sudo killall -u 用户名
查看进程对应文件 ps aux | grep 4874
远程连接host key错误 ssh-keygen -R IP
文件权限部分
把文件拥有者赋给指定用户 sudo chown -R username filename (其中R可选,递归处理内部文件)
查看文件夹访问权限 sudo ls -l filename
将用户添加到组 usermod -G groupname username (这种会把用户从其他组中去掉,只属于该组)
将用户添加到组 usermod -a -G groupname username (把用户添加到这个组,之前所属组不影响)
改变文件所属用户:chown -R username filename
改变文件所属组:chgrp groupname filename
改变文件访问权限 chmod -R (ugo+rwx) filename
递归提取目录内所有文件名
find -目录 -name *.svs >test.txt
查看pytorch版本
import torch
print(torch.__version__)
pytorch比较快的链接:
https://download.pytorch.org/whl/torch_stable.html
pip常用源:
https://pypi.tuna.tsinghua.edu.cn/simple
pip修改源
pip3 config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/
XGboost连接
https://pypi.tuna.tsinghua.edu.cn/simple/xgboost/
网络篇:
https://jingyan.baidu.com/article/7f41ecec5d6014593d095ce0.html
驱动更新篇(因为linux内核自动更新导致nvidia驱动不匹配)
cuda版本切换
阿里云安装
xfcr4 桌面图标混乱或者没有图标,登录对应账号并输入如下命令后重启账号即可
rm ~/.config/xfce4/xfconf/xfce-perchannel-xml/xfce4-panel.xml
ubuntu20 ssh无限重启,查看ssh日志发现是cron导致的,找到对应解决教程
本文章为转载内容,我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题,欢迎原作者联系我们进行内容更正或删除文章。