文章目录

  • 边缘计算场景下的边缘自治
  • 为什么需要边缘自治
  • 边缘业务恢复
  • kubeedge
  • openyurt
  • 业务数据恢复问题
  • 边缘功能恢复
  • openyurt
  • kubeedge
  • 总结


边缘计算场景下的边缘自治

为什么需要边缘自治

在边缘计算场景中,由于云端与边缘计算节点存在物理上的距离,那么很有可能存在边缘节点通过公网连接云端的场景;从公网的不稳定性以及成本等因素考虑,边缘要求断网状态或者弱网状态下边缘业务可以持续运行。

那么传统 K8s 的集群中,架构如下:

kubeedge边缘计算应用 k8s 边缘计算方案_kubernetes


因此在传统 K8s 下,在云边网络异常时,存在如下问题:

问题 1:节点数据由 kubelet 从集群获取,节点异常或重启时,内存数据丢失,网络断连时容器无法恢复;

问题 2:网络长时间断连时,云端控制器认为主机故障而对业务容器进行驱逐;在驱逐后,恢复网络连接后,业务容器将不在预期边缘节点部署;

边缘业务恢复

kubeedge

kubeedge 对 kubelet 进行了功能的裁剪和修改,为 kubeedge 中的 Edged 组件;

kubeedge边缘计算应用 k8s 边缘计算方案_重启_02


边缘节点通过 MetaManager 进行元数据存取,过程如下:

Edged 获取元数据,判断是否可以连接云端,如果可以,则从云端拉取元数据,并更新到本地存储 NodeLevel DataStore,如果无法连接到云端,则直接从本地存储获取元数据;当主机故障或重启,不会由于拿不到云端数据而影响业务恢复。

openyurt

openyurt 没有侵入 K8s,在 kubelet 上加了 YurtHub 层;

kubeedge边缘计算应用 k8s 边缘计算方案_重启_03


kubelet 和云端通信将经由 YurtHub 组件,相当于具有数据缓存功能的"透明网关";同样,在云端网络断连状态下,节点重启,将从本地获取业务相关数据,解决边缘自治问题。

业务数据恢复问题

这里不对方案的优点进行比较,仅看解决业务数据恢复问题的方案和思路相差无几,都是通过 kubelet(edged) 连接 k8s-apiserver 获取数据时进行本地缓存,在云边网络失连时都可以通过拿取本地元数据来进行业务恢复,可以恢复到断网时的业务状态。

边缘功能恢复

边缘不止有计算功能

Pod 需要对内或对外提供服务,边缘节点网络恢复则是不容忽视的一个问题,例如原生 k8s 中节点重启后:

  • Pod IP 发生变化,云边数据不同的问题
  • 路由数据丢失,无法访问相同集群内 pod
  • IPVS 丢失,导致 Service 无法访问

Pod 需要集群管理的 Configmap 和 Secrets 资源,当节点重启时:

  • Pod 启动时,获取不到资源,启动失败

openyurt

openyurt 考虑此类资源同样通过 Yurthub 保存到本地存储,通过从本地获取来实现功能恢复。

kubeedge

待补充 kubeedge 方案

总结

综上,在边缘场景下,我们需要将集群元数据保存到边缘节点本地;云边网络失连时,当边缘节点出现故障时,可以通过获取本地元数据恢复到断网时的状态,实现边缘节点的自治。