K8s容器运行环境安全加固
主要内容
❖ 最小特权原则(POLP)
❖ AppArmor 限制容器对资源访问
❖ Seccomp 限制容器进程系统调用
最小特权原则(POLP)
最小特权原则 (Principle of least privilege,POLP)
:是一种信息安全概念,即为用户提供执行其工作职责所需的最 小权限等级或许可。 最小特权原则被广泛认为是网络安全的最佳实践,也是保护高价值数据和资产的特权访问的基本方式。
最小特权原则 (POLP) 重要性:
- 减少网络攻击面: 当今,大多数高级攻击都依赖于利用特权凭证。通过限制超级用户和管理员权限,最小权限执行有 助于减少总体网络攻击面。
- 阻止恶意软件的传播: 通过在服务器或者在应用系统上执行最小权限,恶意软件攻击(例如SQL注入攻击)将很难 提权来增加访问权限并横向移动破坏其他软件、设备。
- 有助于简化合规性和审核: 许多内部政策和法规要求都要求组织对特权帐户实施最小权限原则,以防止对关键业务系 统的恶意破坏。最小权限执行可以帮助组织证明对特权活动的完整审核跟踪的合规性。
在团队中实施最小特权原则 (POLP)
- 在所有服务器、业务系统中,审核整个环境以查找特权帐户(例如SSH账号、管理后台账号、跳板机账号);
- 减少不必要的管理员权限,并确保所有用户和工具执行工作时所需的权限;
- 定期更改管理员账号密码;
- 监控管理员账号操作行为,告警通知异常活动。
AppArmor限制容器对资源访问
AppArmor(Application Armor) 是一个 Linux 内核安全模块
,可用于限制主机操作系统上运行的进程的功能。每个进程都可以拥有自己的安全配置文件。安全配置文件用来允许或禁止特定功能,例如网络访问、文件读/写/执行权限等。
Linux发行版内置:
Ubuntu、Debian
Apparmor两种工作模式
-
Enforcement(强制模式)
:在这种模式下,配置文件里列出的限制条件都会得到执行,并且对于违反这些限制条 件的程序会进行日志记录。 -
Complain(投诉模式)
:在这种模式下,配置文件里的限制条件不会得到执行,Apparmor只是对程序的行为进行 记录。一般用于调试。
常用命令
apparmor_status:
查看AppArmor配置文件的当前状态的apparmor_parser:
将AppArmor配置文件加载到内核中
apparmor_parser <profile>
# 加载到内核中apparmor_parser -r <profile>
# 重新加载配置apparmor_parser -R <profile>
# 删除配置
aa-complain:
将AppArmor配置文件设置为投诉模式,需要安装apparmor-utils软件包aa-enforce:
将AppArmor配置文件设置为强制模式,需要安装apparmor-utils软件包
K8s使用AppArmor的先决条件
- K8s版本v1.4+,检查是否支持:
kubectl describe node |grep AppArmor
- Linux内核已启用AppArmor,查看
cat /sys/module/apparmor/parameters/enabled
- 容器运行时需要支持AppArmor,目前Docker已支持
AppArmor 目前处于测试阶段,因此在注解中指定AppArmor策略配置文件。 示例:
<container_name>
Pod中容器名称
<profile_ref>
Pod所在宿主机上策略名,默认目录/etc/apparmor.d
apiVersion: v1
kind: Pod
metadata:
name: hello-apparmor
annotations:
container.apparmor.security.beta.kubernetes.io/<container_name>: localhost/<profile_ref>
AppArmor的工作流程
案例实施
案例:容器文件系统访问限制
步骤:
- 将自定义策略配置文件保存到/etc/apparmor.d/
- 加载配置文件到内核:apparmor_parser
- Pod注解指定策略配置名
测试环境:
当前使用Ubuntu系统搭建的Kubernetes集群
[root@master01:~]# lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 20.04.4 LTS
Release: 20.04
Codename: focal
[root@master01:~]# kubectl get node
NAME STATUS ROLES AGE VERSION
master01 Ready control-plane,master 3h11m v1.22.1
node1 Ready <none> 3h11m v1.22.1
node2 Ready <none> 3h11m v1.22.1
示例:限制容器对目录或者文件的访问
- 第一行:导入依赖,遵循C语言约定
- 第二行:指定策略名
- 第三行:{} 策略块
[root@master01:~]# vi /etc/apparmor.d/k8s-deny-write
#include <tunables/global>
profile k8s-deny-write flags=(attach_disconnected) {
#include <abstractions/base>
file, # 允许所有文件读写
deny /bin/** w, # 拒绝所有文件写
deny /data/www/** w,
}
权限解析如下:
自定义策略配置文件
- 创建k8s-deny-write的文件
- 如果Pod没有设置调度,则需要所有节点传送该配置文件
- 在当前的
Master
节点添加策略配置文件 - 配置拒绝在
/opt、/bin、/data/www
目录下写入 - 记住profile后面的
k8s-deny-write
名称
[root@master01:~]# cat /etc/apparmor.d/k8s-deny-write
#include <tunables/global>
profile k8s-deny-write flags=(attach_disconnected) {
#include <abstractions/base>
file,
deny /opt/** w,
deny /data/www/** w,
deny /bin/** w,
}
[root@master01:~]# apparmor_parser -r /etc/apparmor.d/k8s-deny-write
[root@master01:~]# apparmor_status | grep k8s
k8s-deny-write
/usr/bin/sleep (311122) k8s-deny-write
Pod注解指定策略配置
- 配置annotations: 字段,
nginx
是容器名称,k8s-deny-write
是策略配置名称 - 调度在配置好策略配置的节点
- 执行
24h
的休眠状态
[root@master01:~]# cat pod.yaml
apiVersion: v1
kind: Pod
metadata:
labels:
run: nginx
name: nginx
annotations:
container.apparmor.security.beta.kubernetes.io/nginx: localhost/k8s-deny-write
spec:
nodeName: master01
containers:
- image: nginx
name: nginx
imagePullPolicy: IfNotPresent
command:
- sleep
- 24h
[root@master01:~]# kubectl apply -f pod.yaml
pod/nginx created
[root@master01:~]# kubectl get pods
NAME READY STATUS RESTARTS AGE
nginx 1/1 Running 0 6s
进入容器进行测试:
可以发现三个目录全部拒绝
/data/www/目录并没有创建依旧生效
[root@master01:~]# kubectl exec -it nginx -- bash
root@nginx:/# cd /opt/
root@nginx:/opt# touch a
touch: cannot touch 'a': Permission denied
root@nginx:/opt# touch /bin/a
touch: cannot touch '/bin/a': Permission denied
root@nginx:/opt# mkdir -p /data/www
root@nginx:/opt# touch a /data/www/
touch: cannot touch 'a': Permission denied
Seccomp 限制容器进程系统调用
调用关系图
对于 Linux 来说,用户层一切资源相关操作都需要通 过系统调用来完成;系统调用实现技术层次上解耦, 内核只关心系统调用API的实现,而不必关心谁调用的。
Seccomp内核支持
Seccomp(Secure computing mode) 是一个 Linux 内核安全模块
,可用于应用进程允许使用的系统调用。 容器实际上是宿主机上运行的一个进程,共享宿主机内核,如果所有容器都具有任何系统调用的能力,那么容器如果被 入侵,就很轻松绕过容器隔离更改宿主机系统权限或者进入宿主 机。 这就可以使用Seccomp机制限制容器系统调用,有效减少攻击面。
Linux发行版内置:
CentOS、Ubuntu
Seccomp在Kubernetes 1.3版本引入,在1.19版本成为GA版本,因此K8s中使用Seccomp可以通过以下两种方式:
1.19版本+
apiVersion: v1
kind: Pod
metadata:
name: hello-seccomp
spec:
securityContext:
seccompProfile:
type: Localhost
localhostProfile: <profile> # Pod所在宿主机上策略文件名,默认目录:/var/lib/kubelet/seccomp
containers:
禁止容器使用chmod
- 在/var/lib/kubelet/的目录下创建seccomp目录
- 编写chmod.json文件
- seccomp基本配置文件包括三个元素:
-
defaultAction
:在syscalls部分未定义的任何 系统调用默认动作为允许 syscalls
-
names
系统调用名称,可以换行写多个 -
SCMP_ACT_ERRNO
阻止系统调用
[root@master01:~]# mkdir /var/lib/kubelet/seccomp
[root@master01:~]# vi /var/lib/kubelet/seccomp/chmod.json
{
"defaultAction": "SCMP_ACT_ALLOW",
"syscalls": [
{
"names": [
"chmod"
],
"action": "SCMP_ACT_ERRNO"
}
]
}
创建Pod测试,chmod命令不能使用:
[root@master01:~]# cat pod.yaml
apiVersion: v1
kind: Pod
metadata:
labels:
run: nginx
name: nginx
spec:
nodeName: master01
containers:
- image: nginx
name: nginx
imagePullPolicy: IfNotPresent
securityContext:
seccompProfile:
type: Localhost
localhostProfile: chmod.json
能使用:
[root@master01:~]# cat pod.yaml
apiVersion: v1
kind: Pod
metadata:
labels:
run: nginx
name: nginx
spec:
nodeName: master01
containers:
- image: nginx
name: nginx
imagePullPolicy: IfNotPresent
securityContext:
seccompProfile:
type: Localhost
localhostProfile: chmod.json