健康检查

健康检查是指容器运行过程中根据用户需要定时检查容器健康状况或是容器中应用的健康状况。

应用存活探针(liveness probe)

应用存活探针用于判断容器是否存活。该检查方式用于检测容器是否存活,类似于我们执行 ps 命令检查进程是否存在。如果容器的存活检查失败,集群会对该容器执行重启操作;若容器的存活检查成功则不执行任何操作。

应用业务探针(readiness probe)

应用业务探针用于判断容器是否启动完成,业务是否就绪、是否可以接收请求。该检查方式用于检测容器是否准备好开始处理用户请求。一些程序的启动时间可能很长,比如要加载磁盘数据或者要依赖外部的某个模块启动完成才能提供服务。这时候程序进程在,但是并不能对外提供服务。这种场景下该检查方式就非常有用。检测失败,则容器会从 service 的 endpoint 对象里移除。

超时时间

超时时间单位为秒。默认超时等待时间为 1 秒。最大 600s。例如,设置为 10,表明执行健康检查的超时等待时间为 10秒,如果超过这个时间,本次健康检查就被视为失败。

探测周期

探测周期单位为秒。探测周期(秒)默认10 秒,范围 1~600s。

命令行脚本

当前支持命令行脚本模式,在容器/进程内部执行一个命令,如果该命令的退出状态码为 0,表示容器健

康。

命令行脚本格式类似新建负载时的启动命令,需要分行填写。

示例脚本:


/bin/bash

-c

while true; do echo hello; sleep 10; done

负载新建过程中通过「更多设置」可进入健康检查页面:

健康检查配置页面: