1. docker进程僵死无法启动服务
#查看docker状态异常
#使用systemctl (start、restart、stop) docker 均会卡死
#查看/run/containerd没有配置信息
#查看该服务进程
ps -ef | grep docker
#手动进行杀死恢复
kill -s 9 pid
2. docker内存泄漏
#报错信息
Warning FailedCreatePodSandBox 12m (x231 over 7h38m) kubelet, 192.168.1.20 (combined from similar events): Failed create pod sandbox:
rpc error: code = Unknown desc = failed to start sandbox container for pod "centralized-paas-admin-mysql01-slave-7hs5l":
Error response from daemon: OCI runtime create failed: container_linux.go:345:
starting container process caused "process_linux.go:281: applying cgroup configuration for process caused \"mkdir /sys/fs/cgroup/memory/kubepods/besteffort/pod76759db8-fa79-4f9c-b975-7875d77bc4fb
/f8377babc2a32f0383c7e04dc0ca122a11bea2ab6a87325a46fa6d30b815a45f: cannot allocate memory\"": unknown
#关键字
/sys/fs/cgroup/memory/kubepods/besteffort/
#状况,显示为create状态或pending状态
登陆主机发现主机容器全部挂掉了
症状
#查看容器数量越来越多
[ecip@cmpaas~]$ sudo docker ps -a | wc -l
170
[ecip@cmpaas ~]$ sudo docker ps -a | wc -l
260
[ecip@cmpaas ~]$ sudo docker ps -a | wc -l
284
[ecip@cmpaas ~]$ sudo docker ps -a | wc -l
296
[ecip@cmpaas ~]$ sudo docker ps -a | wc -l
314
#解决方法,重启主机
3.docker二进制文件不匹配
docker: Error response from daemon: no status provided on response: unknown.
可能是二进制执行文件和服务文件不匹配导致的
我之前yum安装的docker,估计拷贝的时候忘了,用的之前环境的导致容器一致起不来
4. docker升级失败
隐约记得是19版本下的01升级到14
升级失败后无法启动,还原后也无法正常运行
将数据目录干掉也不能用
错误原因containerd数据未清理
需要删除
1, docker数据目录
2, container 好像是/run/containerd目录 和/var/run/containerd目录
需要先停止docker服务