创建报警

Note

使用报警管理服务需要进行实名认证,如果未进行实名认证,建议您先进行实名认证。

目前支持的模块和报警项如下:

模块报警类型报警项
容器服务(经典网络)状态维度报警工作负载:CPU利用率(%)、内存使用率(%)、磁盘读 IOPS(op/s)、磁盘写 IOPS(op/s)、磁盘读吞吐量(KB/s)、磁盘写吞吐量(KB/s)、磁盘空间利用率(%)、内网网络流出量(Kbps)、内网网络流入量(Kbps)、公网网络流出量(Kbps)、公网网络流入量(Kbps); Ingress:活跃连接数、后端错误连接数、网络流入带宽(Kbps)、网络流出带宽(Kbps)、每秒包转入数、每秒新建连接数、每秒包转出数、健康后端数
容器服务(VPC)状态维度报警工作负载-系统盘、CPU 与私有网络:CPU 使用率(%)、内存使用率(%)、磁盘空间利用率(%)、磁盘读吞吐量(KB/s)、磁盘写吞吐量(KB/s)、磁盘读 IOPS(op/s)、磁盘写 IOPS(op/s)、内网网络流入量(Kbps)、内网网络流出量(Kbps);工作负载-云硬盘:磁盘读吞吐量(KB/s)、磁盘写吞吐量(KB/s)、磁盘读 IOPS(op/s)、磁盘写 IOPS(op/s);工作负载-公网:网络流出量(Kbps)、网络流入量(Kbps);Ingress:每秒新建连接数、健康后端数
云服务器(经典网络)状态维度报警系统盘、CPU与内存:CPU利用率(%)、内存使用率(%)、占用内存量(MB)、磁盘读吞吐量(KB/s)、磁盘写吞吐量(KB/s)、磁盘读 IOPS(op/s)、磁盘写 IOPS(op/s);文件系统:磁盘剩余空间(MB)、磁盘空间利用率(%);云硬盘:磁盘读吞吐量(KB/s)、磁盘写吞吐量(KB/s)、磁盘读 IOPS(op/s)、磁盘写 IOPS(op/s);公网:网络流出量(Kbps)、网络流入量(Kbps);私有网:网络流出量(Kbps)、网络流入量(Kbps);
云服务器(VPC)状态维度报警系统盘、CPU、内存与私有网络:CPU 使用率(%)、内存使用率(%)、占用内存量(MB)、磁盘读吞吐量(KB/s)、磁盘写吞吐量(KB/s)、磁盘读 IOPS(op/s)、磁盘写 IOPS(op/s)、磁盘读操作延时(ms/op)、磁盘写操作延时(ms/op)、网络流出量(Kbps)、网络流入量(Kbps);文件系统:磁盘剩余空间(MB)、磁盘空间利用率(%);云硬盘:磁盘读吞吐量(KB/s)、磁盘写吞吐量(KB/s)、磁盘读 IOPS(op/s)、磁盘写 IOPS(op/s);公网:网络流出量(Bytes/min)、网络流入量(Bytes/min);
云服务器事件报警云服务器实例变化为任意状态、云服务器实例变化为创建中、云服务器实例变化为运行中、云服务器实例变化为关机、云服务器实例变化为停止中、云服务器实例变化为重启中、云服务器实例变化为启动中、云服务器实例变化为镜像恢复中、云服务器实例变化为变配中、云服务器实例变化为已删除、云服务器实例变化为异常
关系型数据库状态维度报警CPU 利用率(%)、内存使用率(%)、占用内存量(MB)、系统盘利用率(%)、磁盘空间利用率(%)、占用磁盘存储空间(MB)、磁盘 IO 利用率(%)、磁盘读操作延时(ms/op)、磁盘写操作延时(ms/op)、磁盘读取字节数(KB/s)、磁盘写入字节数(KB/s)、磁盘读取次数(op/s)、磁盘写入次数(op/s)、网络流入带宽(KB/s)、网络流出带宽(KB/s)、binlog 文件大小(MB)、BufferPool 命中率(%)、插入操作(op/s)、删除操作(op/s)、更新操作(op/s)、查询操作(op/s)、一般事务提交操作(op/s)、二级段事务提交操作(op/s)、每秒查询数(op/s)、慢查询数量(op/s)、SecondBehindMaster(second)、数据库连接数(connection)、活跃连接数(connection)
关系型数据库事件报警数据库实例服务质量发生抖动、数据库实例服务恢复可用、数据库实例复制出错、数据库实例复制出错恢复、数据库实例复制延迟超时、数据库实例复制超时恢复正常
MongoDB复制集实例状态维度报警CPU 利用率(%)、内存利用率(%)、内存使用量(MB)、系统盘空间利用率(%)、磁盘可用空间(MB)、数据盘空间利用率(%)、数据盘空间使用量(MB)、数据盘读取延迟(ms/op)、数据盘写入延迟(ms/op)、数据盘读取带宽(KB/s)、数据盘写入带宽(KB/s)、数据盘读请求频率(op/s)、数据盘写请求频率(op/s)、待处理读请求队列长度、待处理写请求队列长度、IO 利用率(%)、网络流入带宽(KB/s)、网络流出带宽(KB/s)、当前连接数、复制延迟(Seconds)、索引个数、慢查询个数
MongoDB分片集群实例-mongos状态维度报警当前连接数、CPU 利用率(%)、内存使用量(MB)、内存利用率(%)、网络流入带宽(KB/s)、网络流出带宽(KB/s)
MongoDB分片集群实例-shard状态维度报警当前连接数、复制延迟(Seconds)、索引个数、慢查询个数、CPU 利用率(%)、内存利用率(%)、内存使用量(MB)、系统盘空间利用率(%)、磁盘可用空间(MB)、数据盘空间利用率(%)、数据盘空间使用量(MB)、数据盘读取延迟(ms/op)、数据盘写入延迟(ms/op)、待处理读请求队列长度、待处理写请求队列长度、数据盘读取带宽(KB/s)、数据盘写入带宽(KB/s)、数据盘读请求频率(op/s)、数据盘写请求频率(op/s)、IO 利用率(%)、网络流入带宽(KB/s)、网络流出带宽(KB/s)
Redis状态维度报警客户端数量、全部 KEY 数量、待超时 KEY 数量、每分钟惩罚 KEY 数量、每分钟过期 KEY 数量、每秒钟操作数(op/s)、命中率(%)、CPU 使用率(%)、内存使用率(%)、内存碎片率(%)
Memcached状态维度报警客户端数量、全部 KEY 数量、超时 KEY 数量、每分钟惩罚 KEY 数量、每分钟过期 KEY 数量
Elasticsearch-Elasticsearch节点状态维度报警CPU 利用率(%)、数据盘读取延时(ms/op)、数据盘写入延时(ms/op)、数据盘读取字节数(KB/s)、数据盘写入字节数(KB/s)、磁盘读取次数(op/s)、磁盘写入次数(op/s)、数据盘空间利用率(%)、数据盘空间使用量(MB)、内存使用量(MB)、内存利用率(%)、网络流入带宽(KB/s)、网络流出带宽(KB/s)
Elasticsearch-Logstash 节点状态维度报警CPU 利用率(%)、内存利用率(%)、内存使用量(MB)、网络流入带宽(KB/s)、网络流出带宽(KB/s)
Elasticsearch事件报警修改规格失败
消息队列状态维度报警消息队列实例:ack 速度(msg/s)、channel 数量、confirm 速度(msg/s)、连接数量、消费者数量、deliver 速度(msg/s)、消息总数、ready 消息数(MULL)、unack 消息数、publish 速度(msg/s)、队列数量;队列:消费者个数、消息消费速率(msg/s)、未确认消息数、消息发布速率(msg/s)
消息队列事件报警实例离线、实例故障、主从切换、流控报警、实例升配失败
Kafka状态维度报警CPU 利用率(%)、内存利用率(%)、数据盘读取延时(ms/op)、数据盘写入延时(ms/op)、数据盘读取字节数(KB/s)、数据盘写入字节数(KB/s)、磁盘读取次数(op/s)、磁盘写入次数(op/s)、数据盘空间利用率(%)
Kafka事件报警服务状态异常、服务状态异常恢复、Broker 状态异常、Broker 状态异常恢复
负载均衡(经典网络)状态维度报警活跃连接数、非活跃连接数、连接创建平均耗时(ms)、连接平均总耗时(ms)、LB 到 instance 响应时间(ms)、健康 instance 数、不健康 instance 数、http 请求数、http 响应 2xx 个数、http 响应 3xx 个数、http 响应 4xx 个数、http 响应 5xx 个数、流入流量(KB)、流出流量(KB)
负载均衡(VPC)状态维度报警http 响应 2xx 个数、http 响应 3xx 个数、http 响应 4xx 个数、http 响应 5xx 个数、每秒新建连接数(个)、健康后端数(个)
文件存储状态维度报警文件系统空间使用率(%)
文件存储事件报警自动快照失败
应用监控事件报警错误事件、离线事件
DDoS防护事件报警清洗:表示流量超过了用户设置的清洗阈值或者默认清洗阈值,该IP流量进入清洗状态,会有少量正常业务流量也会受影响;黑洞:表示IP流量超过了黑洞阈值,即bps超过了5Gbps,IP被拉黑,将无法访问;恢复正常:表示流量已恢复正常;解封:用户 IP 恢复正常访问

Note

任何一条规则满足条件即触发报警;

报警阈值聚合区间和步长支持自行设置,触发报警。

操作步骤

  1. 登录 控制台,点击「报警管理」标签;
  2. 点击「创建报警」按钮;
  3. 按需填写内容,勾选通知对象,也可以在此新增报警联系组,报警联系组相关操作详见:报警联系组管理

填写完成后点击「立即创建」即可。