云成本:你无法管理你看不到的东西_运维

经济不确定性是所有组织最关心的问题,许多组织都在寻找在这段艰难时期削减开支的方法。然而,TechTarget/Computer Weekly IT 优先事项研究显示,基于云的项目的重要性逐年显著增加。团队如何平衡他们想要的速度以及部署和运行这些实施的成本?

团队将云视为不落后的关键。它提供了公平的竞争环境,使他们能够通过简单的按使用付费模式更快地发展,这种模式一开始是预算友好的。然而,随着云的采用和使用增加,成本也会随之增加。

根据 Flexera 最近的一份报告,管理云支出已成为 82% 受访者的首要任务。原因很容易理解,尤其是当云支出失控时。举个例子——在云监控供应商 Datadog 最近的财报电话会议上,透露一位客户在 2022 年第一季度被收取了 6500 万美元的账单。

那么,你能做些什么来避免同样的命运呢?以下是更好地管理云计算成本的几种有效策略:

获得全面可见性

您无法管理您看不到的东西。尽管随着集中式云和 IT 团队的协作,失控的影子 IT 时代正在减少,但要了解您的所有云支出来自何处可能很困难,尤其是当 Flexera 的数据显示 87% 的组织已采用多云策略时。

为了管理这一点,他们不仅需要了解自己的支出,还需要了解他们的云、应用程序和微服务的使用习惯,甚至了解哪些特定团队和用户使用最多、花费最多和浪费最多。

监控微服务和支出

云应用程序(尤其是原生应用程序)通常使用在基于云的容器和无服务器技术上运行的微服务构建。微服务提供了一定程度的抽象,使应用程序更易于开发,部署和扩展速度更快。

然而,它们也有一些缺点,因为它们抽象了物理层,可以在几分钟内打开和关闭,这使得它们很难跟踪和监控。因此,云的使用量和成本可能会急剧上升,而您唯一可能了解这一点的时间就是收到云账单时。监控物理或虚拟基础设施的传统工具以及云提供商提供的内置监控功能不足以跟踪详细的使用情况、支出和浪费。

这在很大程度上取决于开发人员如何设置他们的微服务。在最近的一项研究中,我们发现容器环境中有 69% 的 CPU 资源未使用。由于公司根据分配的图像资源支付容器费用,因此您可以看到这会导致数百万美元的浪费。

因此,必须找到更好的方法来监控微服务和云的使用情况和支出。第一个选择是使用开源监控工具(如 Prometheus)来跟踪使用情况,以及跟踪支出的其他项目。

这些在开始时很有用,但在需要扩展和监控大规模环境时可能会带来挑战。团队需要管理和运营监控环境,这本身就是一项艰巨的任务。请记住,开源软件是免费的,但这并不意味着运营监控环境本身也是免费的。

另一种方法是使用支持多云和微服务的第三方监控解决方案。如果采用这种方式,请找到一种不仅提供表面级监控的解决方案,而且还能让您深入了解特定资源(如 pod、节点和命名空间)以及特定应用程序和用户。最好的解决方案不仅提供使用情况或支出指标,还提供有关如何适当调整工作负载规模的建议,以便在不影响应用程序性能的情况下优化支出。

持续跟踪、优化

一旦云和微服务监控产品到位,就应该开发流程来定期跟踪使用情况并优化环境和成本。例如,企业应该寻找按应用程序和用户细分的支出大户。分析请求的资源量与实际使用量,以确定安全护栏以削减和适当调整工作负载。这些是否被过度分配或过度配置?如果是,它们很可能被安全地调整到适当大小。

理想情况下,企业的流程中应该内置一个反馈回路。一旦工作负载大小合适,就需要监控其性能。这包括检查在任何更改后是否满足 SLA 以及是否实现了预期的成本节省。

了解您的成本模型

如今,大多数云提供商的定价都非常透明。但是,了解服务成本并不意味着了解其使用频率和使用量。监控解决方案可以帮助更好地了解。但是,不要忽视监控解决方案的定价模型。上述 6500 万美元云账单的讽刺之处在于,它只针对监控解决方案本身。

监控对于了解应用程序至关重要,成本会随着应用程序的扩展而增长。了解这些监控成本如何扩展有助于降低云和监控费用。

对于希望利用云速度的开发人员来说,成本管理并不总是首要任务。他们很容易发展环境,但忘记停下来更好地了解使用情况、性能和成本之间的关系。然而,在经济时代,团队被要求仔细审查所有支出,深入了解公司的云成本可能是一种轻松的成本节约方式。