监控突发性能实例-阿里云服务器(云淘)
本文介绍如何通过ECS管理控制台查看突发性能实例的CPU使用率和CPU积分,并通过云监控管理控制台设置CPU积分报警规则。
前提条件
如果您需要设置通知对象,您必须提前创建联系人组。具体操作,请参见创建报警联系人或报警联系组。
背景信息
由于突发性能实例的CPU积分变化直接影响CPU使用率和实例负载性能,您可以在云监控管理控制台对一台或多台突发性能实例设置已消耗CPU积分、累积CPU积分、超额CPU积分或者预支CPU积分的监控报警方案。突发性能实例CPU积分的监控指标说明如下表所示。
监控指标 | 说明 |
突发性能实例-已消耗CPU积分 | 消耗CPU积分的变化,趋势和CPU使用率保持同步。更多信息,请参见CPU积分。 |
突发性能实例-累积CPU积分 | CPU积分余额的变化,用于维持CPU使用率的CPU积分。更多信息,请参见CPU积分。 |
突发性能实例-超额CPU积分 | 超额CPU积分的变化,仅打开无性能约束模式后会消耗超额CPU积分。更多信息,请参见性能模式。 |
突发性能实例-预支CPU积分 | 预支CPU积分的变化,仅打开无性能约束模式后会消耗预支CPU积分。更多信息,请参见性能模式。 |
查看CPU积分使用信息
以下步骤示范了如何通过ECS管理控制台查看突发性能实例的积分实时变化曲线。
- 您在ECS管理控制台查看的CPU使用率是云服务器内部操作系统监控的CPU使用率,不作为CPU积分消耗依据。
- CPU积分消耗所基于的CPU使用率是在物理机层面采集的(包含了云服务器内部特权指令的模拟开销),您可以登录云监控管理控制台,在主机监控页面单击实例ID,然后在基础监控页签中查看相关数据。更多信息,请参见主机监控概览。
创建CPU积分报警规则
以下步骤示范了如何通过云监控管理控制台创建突发性能实例-累积CPU积分以及突发性能实例-超额CPU积分报警规则。其中:
- 在性能约束模式下,如果突发性能实例没有可用的CPU积分,CPU使用率无法超过基准性能。因此监控突发性能实例-累积CPU积分可以保证您在实例性能受限的情况下收到通知,决定是否打开无性能约束模式。
- 在无性能约束模式下,为保持CPU使用率超过基准性能,如果突发性能实例消耗了所有预支积分后还需要使用超额CPU积分,超额CPU积分按小时出账单并收取费用。因此监控突发性能实例-超额CPU积分可以保证您在产生超额CPU积分计费时收到通知,决定是否关闭无性能约束模式。
- 产品:选择云服务器ECS。
- 资源范围:选择实例。
- 关联资源:选择一台或多台突发性能实例。
- 规则名称:自定义填写。
- 指标类型:选择单指标。
- 监控指标和阈值及报警级别:设置报警规则以及判断标准。
- 监控突发性能实例-累积CPU积分:选择实例维度 > (ECS)突发性能实例-累计CPU积分,本文示例中,设置的报警判断标准为以1分钟为周期,持续1分钟突发性能实例-累积CPU积分的平均值都小于1,则触发报警。 说明 累积CPU积分小于1时,在性能约束模式下,突发性能实例的CPU使用率将无法超过基准性能;在无性能约束模式下,如果CPU使用率超过基准性能,突发性能实例将开始消耗预支积分和超额CPU积分。根据您对性能约束的容忍程度,您也可以设置为连续多个周期的平均值。
- 监控突发性能实例-超额CPU积分: 选择实例维度 > (ECS)突发性能实例-超额CPU积分,本文示例中,设置的报警判断标准为以1分钟为周期,持续1分钟突发性能实例-超额CPU积分的平均值都大于0,则触发报警。 说明 超额CPU积分大于0意味着突发性能实例产生了超额积分,开始计费。根据您对超额积分计费的容忍程度,您也可以设置为连续多个周期的平均值。
- 监控突发性能实例-已消耗CPU积分:选择实例维度 > (ECS)突发性能实例-已消耗CPU积分。
- 监控突发性能实例-预支CPU积分:选择实例维度 > (ECS)突发性能实例-预支CPU积分。
- 设置报警回调和报警触发。
- 报警回调:公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。
- 弹性伸缩:如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。
- 日志服务:如果您打开日志服务开关,当报警发生时,会将报警信息写入日志服务的日志库。
- 消息服务MNS-Topic:如果您打开消息服务MNS-Topic开关,当报警发生时,会将报警信息写入消息服务的主题。
- 设置无数据处理方法:无监控数据时报警的处理方式。默认取值不做任何处理。
相关文档
- 创建报警规则
- 管理自定义监控大盘中的监控图表
- 打开/关闭无性能约束模式
发表评论