Kubernetes HPA：智能缩放应用以应对访问高峰

文章来源：企鹅号 - 希里安运维开发

近日见闻

天冷注意保暖！

Linux的基础知识越学越觉得匮乏。

摘抄：

为最坏的情况做好准备，

为最好的情况敞开心扉。

——斯鲁日特尔《莫斯科小猫》

我们都知道，应用的流量可以说是波动不定。一款应用可能会在某个时间点突然遭遇巨大的访问量，而在其他时候则可能门可罗雀。为了应对这种情况，自动化缩放服务成为了维持服务稳定性和成本效率的关键。今天我们将介绍 Kubernetes 的一个强大功能 —— 水平Pod自动伸缩（Horizontal Pod Autoscaler，简称HPA），它可以帮助我们智能地调整应用的规模。

这里也可以参考官方给的例子：https://kubernetes.io/zh-cn/docs/tasks/run-application/horizontal-pod-autoscale-walkthrough/

什么是HPA？

Kubernetes HPA 允许用户根据特定的度量，如CPU或内存利用率，自动增加或减少Pod的数量。这意味着，当应用的负载增加时，HPA可以自动启动更多的Pod来处理增加的负载。相对地，当负载降低时，它也会减少Pod的数量以节省资源。

HPA的工作原理

HPA使用 Kubernetes Metrics API 获取选定资源的当前使用情况。然后，它会将实际使用情况与我们在HPA配置中设定的目标使用率进行比较，并据此调整Pod的数量。

实施HPA的步骤

为了使用HPA，我们首先需要一个运行中的 Kubernetes 集群，并且 metrics-server 必须在集群上运行。metrics-server 用于提供资源使用信息，这对于HPA计算是否需要扩缩容至关重要。

步骤一：部署metrics-server

如果你的集群还没有运行metrics-server，可以通过以下命令进行部署：

kubectl?apply?-f?https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml

步骤二：运行 php-apache 服务器并暴露服务

假设我们有一个简单的web应用需要部署。我们首先创建一个名为php-apache.yaml的service文件：

apiVersion:?apps/v1

kind:?Deployment

metadata:

name:?php-apache

spec:

selector:

matchLabels:

run:?php-apache

template:

metadata:

labels:

run:?php-apache

spec:

containers:

-?name:?php-apache

image:?registry.k8s.io/hpa-example

ports:

-?containerPort:?80

resources:

limits:

cpu:?500m

requests:

cpu:?200m

---

apiVersion:?v1

kind:?Service

metadata:

name:?php-apache

labels:

run:?php-apache

spec:

ports:

-?port:?80

selector:

run:?php-apache

使用kubectl命令部署这个应用：

kubectl?apply?-f?php-apache.yaml

步骤三：创建HPA

现在我们的应用正在运行，我们要创建HPA以自动调整Pod的数量来应对负载变化。使用这个命令来创建HPA：

kubectl?autoscale?deployment?php-apache?--cpu-percent=50?--min=1?--max=10

在这个例子中，我们设置了HPA来监控php-apache deployment，Pod数量的最小值和最大值分别为1和10，目标CPU使用率设定为50％。

步骤四：监控HPA状态

一旦HPA创建完成，我们可以通过如下命令来监控它的状态：

kubectl?get?hpa

当CPU利用率超过50%时，HPA将自动增加Pod的数量直至最多10个。当负载降低，CPU利用率低于50%时，Pod的数量也会相应减少。

增加负载

启动一个不同的 Pod 作为客户端。客户端 Pod 中的容器在无限循环中运行，向 php-apache 服务发送查询。自动扩缩器如何对增加的负载做出反应。如下图所示，根据负载增加，pod数也相应的增加了。

#?在单独的终端中运行它

#?以便负载生成继续，你可以继续执行其余步骤kubectl?run?-i?--tty?load-generator?--rm?--image=busybox:1.28?--restart=Never?--?/bin/sh?-c?"while?sleep?0.01;?do?wget?-q?-O-?http://php-apache;?done"

停止产生负载

在我们创建 busybox 容器的终端中，输入+ C 来终止负载的产生。

然后验证结果状态（时间根据硬件不同）：

# 准备好后按 Ctrl+C 结束观察

kubectl get hpa php-apache --watch

一旦 CPU 利用率降至 0，HPA 会自动将副本数缩减为 1。

结论

在现代应用部署中，HPA是一个不可或缺的工具，能够保障应用在负载波动时的稳定性，并且有助于节省成本。通过这篇文章，应该知道了如何在 Kubernetes 集群中实现HPA的基础知识和操作指南。快去实践一下吧！

发表于: 2024-01-302024-01-30 18:08:27
原文链接：https://page.om.qq.com/page/OJbca3FmcJr8J6bsFYnuQI-w0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

Kubernetes HPA：智能缩放应用以应对访问高峰

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐