- 产品文档
- > 数据库
- > Elasticsearch
- > 使用指南
- > 监控报警
性能监控
操作步骤
- 登录 「控制台」,定位目标实例,点击「实例名称」;
- 在实例详情页,点击「性能监控」标签:
该页面展示了当前实例在服务器共计十二种性能数据,提供三项统计指标供选择,并基于用户指定的时间范围,提供不同聚合区间的监控功能。 监控项页面提供监控数据的曲线图展示,详情如下:CPU 利用率、内存利用率、内存使用量、数据盘空间使用量、数据盘读取次数、数据盘写入次数、数据盘读取字节数、数据盘写入字节数、数据盘读取延迟、数据盘写入延迟、网络流出带宽、网络流入带宽;
时间范围与聚合区间
提供过去 3 小时、24 小时、48 小时和 7 天等时间范围快捷按钮,点击即可查看相应时间范围内的监控数据。 支持自定义时间范围,点击「自定义」,即可设定任意时间范围查看相应时段的监控数据。 根据时间范围大小,系统提供不同聚合区间供选择。
统计指标
系统提供三种性能监控统计指标:最大值、最小值、平均值。点击统计指标选择框可调整监控数据的统计指标。
报警
使用场景
检测到某个或某些实例异常时,发送短信通知报警组内的所有联系人。
支持的报警项
状态维度报警
CPU利用率(%)、占用磁盘存储空间(MB)、磁盘写入次数(次/秒)、磁盘读取次数(次/秒)、磁盘写入字节数(KB/s)、磁盘读取字节数(KB/s)、磁盘写操作延时(ms/op)、磁盘读操作延时(ms/op)、磁盘空间利用率(%)、内存使用率(%)、占用内存量(MB)、系统盘利用率(%)
事件报警
扩容失败
操作步骤
详见 创建报警
集群的状态
集群的状态包括:正常、警告、异常,其中:
1.正常:所有的主分片和副本分片都已分配。你的集群是 100% 可用的。
2.警告:所有的主分片已经分片了,但至少还有一个副本是缺失的。不会有数据丢失,所以搜索结果依然是完整的。不过,你的高可用性在某种程度上被弱化。如果更多的分片消失,你就会丢数据了。
3.异常:至少一个主分片(以及它的全部副本)都在缺失中。这意味着你在缺少数据:搜索只能返回部分数据,而分配到这个分片上的写入请求会返回一个异常。