各位工作的公司生产 k8s 是怎么维护应用的 request 和 limit 的？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 351 天前的主题，其中的信息可能已经有所发展或是发生改变。

首次上线的时候怎么定？靠压力测试？后续应用不停上线、甚至改配置可能会导致内存、cpu 的变化，如何持续迭代更新每个应用的 request 和 limit 呢？

k8s

维护

迭代

15 条回复 • 2025-01-27 11:01:40 +08:00

mooyo

2025 年 1 月 25 日

我印象中 request 还不能太小，忘了啥原因。

我们之前是所有 pod 固定的 request 和 limit （ request:2 limit:8 ），靠 pod 数量来伸缩，极个别特殊的 pod 手动调整。

zhoudaiyu

PRO

2025 年 1 月 25 日 via iPhone

@mooyo 当机器的 cpu 打满了，会按这台机器的 pod 的 request 比例去分 cpu

vkillwucy

2025 年 1 月 25 日 via Android

用不明白，就设置一样😁

looplj

2025 年 1 月 25 日

初始化一般业务评估就行，业务对自己的业务量应该有点数。
然后监控使用率，使用率太低，推进调低，使用率高，推荐提高。

xavi818

2025 年 1 月 25 日

用 vpa 给你推荐下资源配置

zhoudaiyu

PRO

2025 年 1 月 25 日 via iPhone

@xavi818 这个可以，但是第一次上线的时候好像推荐不出来吧
@vkillwucy 我们就是差不多都一样的，但是其实资源使用率差的挺多的
@ZSeptember 业务根本不懂这些，也不管，所以都得靠我们运维推，太难了

stormtrooperx5

2025 年 1 月 25 日

很难搞，我们还因为 req 设置不合理出过线上故障

billzhuang

2025 年 1 月 25 日 via iPhone

设置好 hpa 和 autoscaler

xiaogu2014

2025 年 1 月 25 日

刚上线的时候会设置一个大概的 request 和 limit 。（自己决定哦。同时得配合 hpa ）
后续有一个 tuned request 和 limit 会附加上去。（这块应该是 infra 组来做的。来根据历史来帮你调整。能节省不少资源）
同时后续应用不停上线 cpu 也不会急剧上升。👆会自己帮你调整。当然你得设置好 hpa 来应对突发情况。

7h0m25

2025 年 1 月 26 日

之前维护的比较多的是 Java 项目，Java 项目很多启动的时候会给你一个默认的资源需求参数，稍稍加大一点设置为 request 就好。Limit 的就得看你自己的经验和在测试环境里的压测评估结果来预估了。
之前公司的开发都是外包给三方团队的，代码很垃圾，最夸张的一个 Java 项目启动要四分半才能起来。一开始是让那些开发自己估（毕竟开发才是最清楚自己写的是一堆什么 shit ），结果估了几次给出的参数都是非常离谱的。