• 请不要在回答技术问题时复制粘贴 AI 生成的内容
EthanWalkerTech
V2EX  ›  程序员

K8s 发布失败后,大家第一眼先看哪?

  •  
  •   EthanWalkerTech · 7h 29m ago · 970 views
    最近在看 K8s 的发布链路,发现一个挺现实的问题:发布失败以后,每个人下手的位置不太一样。

    有人先翻 CI ,看是不是镜像没打出来;有人先看 Helm / Argo CD ,确认资源有没有真正下到集群;也有人直接 kubectl describe pod ,先扫 Events 、Pod 状态、Deployment ;还有人第一反应是去看业务日志。

    我有点纠结的是:第一步到底该先确认发布动作有没有真正执行成功,还是直接进集群看 Pod 为什么没起来。

    大家平时遇到这种发布失败,一般第一步看哪里?
    有固定顺序吗,还是看报错现象临时判断?
    15 replies    2026-06-26 01:51:49 +08:00
    owt5008137
        1
    owt5008137  
       6h 30m ago via Android
    打开 AI ,帮我诊断。。。(🐶
    cheng6563
        2
    cheng6563  
       6h 21m ago
    k8s 发布不就是跑命令吗,所以 claude code 一把嗦。
    pollux
        3
    pollux  
       5h 16m ago
    不是先看日志吗?
    beyondstars
        4
    beyondstars  
       5h 10m ago
    kubernetes 资源是互相联系的,从顶层看起,比如 deployment >> replicaset >> pod >> container ,既要看 kubernetes 事件,也要看日志。

    不要无脑给 ai 所有权限让 ai 全权控制你的 k8s 集群,出了问题你没法甩锅给 ai 。可以把你认为可疑的但又不理解的信息丢给 ai 。
    Mystery0
        5
    Mystery0  
       4h 51m ago via Android
    不是应该看报错信息吗
    momocraft
        6
    momocraft  
       4h 32m ago
    想想怎么让自己不用想
    hackroad
        7
    hackroad  
       4h 26m ago
    每个动作不应该埋点日志?失败了通知对应的动作?
    seers
        8
    seers  
       4h 17m ago
    当然是从最底下开始一层层往上了,从现象倒推是最快的
    weiwenhao
        9
    weiwenhao  
       4h 8m ago
    原则上是先看失败日志,一般都是让 cladue 直接操作 kubectl 帮我分析,cladue 都会让我审批我看命令是查询相关的就直接通过。
    winson030
        10
    winson030  
       3h 46m ago
    一般出事都会告警,先看告警日志吧。
    alexluo1
        11
    alexluo1  
       3h 6m ago
    看甲方群
    limusi
        12
    limusi  
       2h 47m ago
    claude code + kubectl 90%的情况 1 分钟内能解
    cctv6
        13
    cctv6  
       2h 6m ago via Android
    kubectl get/describe pod/deploy
    Frankcox
        14
    Frankcox  
       1h 1m ago
    这个要看 devops ,cicd 做的水平
    如果就扔给我一句:“应用发布失败了”
    那我首先要看 deployment, pod 的状态,看是集群问题还是应用问题。
    locoz
        15
    locoz  
       3 mins ago via Android
    当然是不看啊,这点破事还得需要让我来看的话,那说明 AI 出问题了。正常来说应该是 AI 自己处理完,真碰到什么有风险的操作要决策了才来找我,没风险单纯碰到点小问题都该自己解决。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1144 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 56ms · UTC 17:55 · PVG 01:55 · LAX 10:55 · JFK 13:55
    ♥ Do have faith in what you're doing.