CloudWatch 您的 Network Load Balancer 的指标 - Elastic Load Balancing

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CloudWatch 您的 Network Load Balancer 的指标

Elastic Load Balancing 将您的 CloudWatch 负载均衡器和目标的数据点发布到亚马逊。 CloudWatch允许您以一组有序的时间序列数据(称为指标)的形式检索有关这些数据点的统计信息。可将指标视为要监控的变量,而将数据点视为该变量随时间变化的值。例如,您可以在指定时间段内监控负载均衡器的正常目标的总数。每个数据点都有相关联的时间戳和可选测量单位。

您可使用指标来验证系统是否正常运行。例如,您可以创建 CloudWatch 警报来监控指定的指标,并在该指标超出您认为可接受的范围时启动操作(例如向电子邮件地址发送通知)。

CloudWatch 仅当请求流经负载均衡器时,Elastic Load Balancing 才会向其报告指标。如果有请求流经负载均衡器,则 Elastic Load Balancing 进行测量并以 60 秒的间隔发送其指标。如果没有请求流经负载均衡器或指标无数据,则不报告指标。对于带有安全组的网络负载均衡器, CloudWatch 指标中不会捕获安全组拒绝的流量。

有关更多信息,请参阅 Amazon CloudWatch 用户指南

Network Load Balancer 指标

AWS/NetworkELB 命名空间包括以下指标。

指标 描述
ActiveFlowCount

客户端至目标的并发流(或连接)的总数。此指标包含处于 SYN_SENT 和 ESTABLISHED 状态的连接。TCP 连接未在负载均衡器上终止,因此,一个开放与目标的 TCP 连接的客户端将计为一个流。

报告标准:始终报告。

统计数据:最有用的统计工具是 AverageMaximumMinimum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

ActiveFlowCount_TCP

客户端至目标的并发 TCP 流(或连接)的总数。此指标包含处于 SYN_SENT 和 ESTABLISHED 状态的连接。TCP 连接未在负载均衡器上终止,因此,一个开放与目标的 TCP 连接的客户端将计为一个流。

报告标准:有非零值

统计数据:最有用的统计工具是 AverageMaximumMinimum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

ActiveFlowCount_TLS

客户端至目标的并发 TLS 流(或连接)的总数。此指标包含处于 SYN_SENT 和 ESTABLISHED 状态的连接。

报告标准:有非零值。

统计数据:最有用的统计工具是 AverageMaximumMinimum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

ActiveFlowCount_UDP

客户端至目标的并发 UDP 流(或连接)的总数。

报告标准:有非零值。

统计数据:最有用的统计工具是 AverageMaximumMinimum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

ClientTLSNegotiationErrorCount

在客户端和 TLS 侦听器之间协商期间失败的 TLS 握手的总数。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

ConsumedLCUs

负载均衡器使用的负载均衡器容量单位 (LCU) 数量。您需要为每小时使用的 LCU 数量付费。有关更多信息,请参阅 Elastic Load Balancing 定价

报告标准:始终报告。

统计数据:全部

尺寸
  • LoadBalancer

ConsumedLCUs_TCP

负载均衡器为 TCP 使用的负载均衡器容量单位 (LCU) 数量。您需要为每小时使用的 LCU 数量付费。有关更多信息,请参阅 Elastic Load Balancing 定价

报告标准:有非零值。

统计数据:全部

尺寸
  • LoadBalancer

ConsumedLCUs_TLS

负载均衡器为 TLS 使用的负载均衡器容量单位 (LCU) 数量。您需要为每小时使用的 LCU 数量付费。有关更多信息,请参阅 Elastic Load Balancing 定价

报告标准:有非零值。

统计数据:全部

尺寸
  • LoadBalancer

ConsumedLCUs_UDP

负载均衡器为 UDP 使用的负载均衡器容量单位 (LCU) 数量。您需要为每小时使用的 LCU 数量付费。有关更多信息,请参阅 Elastic Load Balancing 定价

报告标准:有非零值。

统计数据:全部

尺寸
  • LoadBalancer

HealthyHostCount

被视为正常运行的目标数量。此指标不包括注册为目标的任何 Application Load Balancer。

报告标准:在启用了运行状况检查时报告。

统计数据:最有用的统计工具为 MaximumMinimum

尺寸
  • LoadBalancer, TargetGroup

  • AvailabilityZone, LoadBalancer, TargetGroup

NewFlowCount

时段内建立的客户端至目标的新流(或连接)的总数。

报告标准:始终报告。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

NewFlowCount_TCP

时段内建立的客户端至目标的新 TCP 流 (或连接) 的总数。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

NewFlowCount_TLS

时段内建立的客户端至目标的新 TLS 流 (或连接) 的总数。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

NewFlowCount_UDP

时段内建立的客户端至目标的新 UDP 流 (或连接) 的总数。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

PeakPacketsPerSecond

最高平均数据包速率(每秒处理的数据包数),在采样窗口期间每 10 秒计算一次。此指标包含运行状况检查流量。

报告标准:有非零值。

统计数据:最有用的统计工具是 Maximum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

PortAllocationErrorCount

客户端 IP 转换操作期间临时端口分配错误的总数。非零值表示断开的客户端连接。

注意:当执行客户端地址转换时,Network Load Balancer 支持与每个唯一目标(IP 地址和端口)的 55,000 个并发连接或每分钟约 55,000 个连接。要修复端口分配错误,请将更多目标添加到目标组。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

ProcessedBytes

负载均衡器处理的字节总数,包括 TCP/IP 标头。此计数包括往返目标的流量,减去运行状况检查流量。

报告标准:始终报告。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

ProcessedBytes_TCP

TCP 侦听器处理的字节的总数。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

ProcessedBytes_TLS

TLS 侦听器处理的字节的总数。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

ProcessedBytes_UDP

UDP 侦听器处理的字节的总数。

报告标准:有非零值

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

ProcessedPackets

负载均衡器处理的总数据包数。此计数包含往返目标的流量,以及运行状况检查流量。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

SecurityGroupBlockedFlowCount_Inbound_ICMP

被负载均衡器安全组的入站规则拒绝的新 ICMP 消息的数量。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

SecurityGroupBlockedFlowCount_Inbound_TCP

被负载均衡器安全组的入站规则拒绝的新 TCP 流的数量。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

SecurityGroupBlockedFlowCount_Inbound_UDP

被负载均衡器安全组的入站规则拒绝的新 UDP 流的数量。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

SecurityGroupBlockedFlowCount_Outbound_ICMP

被负载均衡器安全组的出站规则拒绝的新 ICMP 消息的数量。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

SecurityGroupBlockedFlowCount_Outbound_TCP

被负载均衡器安全组的出站规则拒绝的新 TCP 流的数量。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

SecurityGroupBlockedFlowCount_Outbound_UDP

被负载均衡器安全组的出站规则拒绝的新 UDP 流的数量。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

TargetTLSNegotiationErrorCount

在 TLS 侦听器和目标之间协商期间失败的 TLS 握手的总数。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

TCP_Client_Reset_Count

从客户端发送至目标的重置 (RST) 数据包的总数。这些重置由客户端生成,然后由负载均衡器转发。

报告标准:始终报告。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

TCP_ELB_Reset_Count

负载均衡器生成的重置 (RST) 数据包的总数。有关更多信息,请参阅故障排除

报告标准:始终报告。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

TCP_Target_Reset_Count

从目标发送至客户端的重置 (RST) 数据包的总数。这些重置由目标生成,然后由负载均衡器转发。

报告标准:始终报告。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

UnHealthyHostCount

被视为未正常运行的目标数量。此指标不包括注册为目标的任何 Application Load Balancer。

报告标准:在启用了运行状况检查时报告。

统计数据:最有用的统计工具为 MaximumMinimum

尺寸
  • LoadBalancer, TargetGroup

  • AvailabilityZone, LoadBalancer, TargetGroup

UnhealthyRoutingFlowCount

使用路由失效转移操作(失败时开放)路由的流(或连接)数量。

报告标准:有非零值。

统计数据:最有用的统计工具是 Sum

尺寸
  • LoadBalancer

  • AvailabilityZone, LoadBalancer

网络负载均衡器的指标维度

要筛选负载均衡器的指标,请使用以下维度。

维度 描述
AvailabilityZone

按可用区筛选指标数据。

LoadBalancer

按负载均衡器筛选指标数据。按如下方式指定负载均衡器:net load-balancer-name/1234567890123456(负载均衡器 ARN 的最后一部分)。

TargetGroup

按目标组筛选指标数据。按如下方式指定目标组:targetgroup target-group-name/1234567890123456(目标组 ARN 的最后一部分)。

Network Load Balancer 指标的统计数据

CloudWatch 根据 Elastic Load Balancing 发布的指标数据点提供统计数据。统计数据是在指定的时间段内汇总的指标数据。当请求统计数据时,返回的数据流按指标名称和维度进行识别。维度是用于唯一标识指标的名称/值对。例如,您可以请求在特定可用区内启动的负载均衡器背后所有正常状态 EC2 实例的统计数据。

MinimumMaximum 统计数据反映每个采样窗口中各个负载均衡器节点报告的数据点的最小值和最大值。HealthyHostCount 最大值的增加与 UnHealthyHostCount 最小值的减少相对应。建议监控最大值 HealthyHostCount,在最大值 HealthyHostCount 低于所需的最小值或为 0 时调用警报。这有助于确定目标运行状况何时变得不佳。还建议监控最小值 UnHealthyHostCount,当最小值 UnHealthyHostCount 超过 0 时调用警报。这使您能够在不再有注册目标时意识到此情况。

Sum 统计数据是所有负载均衡器节点的汇总值。由于这些指标在每个周期均包含多个报告,因此 Sum 仅适用于对所有负载均衡器节点进行汇总的指标。

SampleCount 统计数据是测量的样本数。由于这些指标是基于采样间隔和事件进行收集的,因此此统计信息一般没有用。例如,对于 HealthyHostCountSampleCount 基于每个负载均衡器节点报告的样本数,而不是运行状况正常的主机数。

查看您的负载均衡器的 CloudWatch 指标

您可以使用 Amazon EC2 控制台查看您的负载均衡器的 CloudWatch 指标。这些指标显示为监控图表。如果负载均衡器处于活动状态并且正在接收请求,则监控图表会显示数据点。

或者,您可以使用 CloudWatch控制台查看负载均衡器的指标。

使用 Amazon EC2 控制台查看指标
  1. 通过以下网址打开 Amazon EC2 控制台:https://console.aws.amazon.com/ec2/

  2. 要查看按目标组筛选的指标,请执行以下操作:

    1. 在导航窗格中,选择 Target Groups

    2. 选择目标组并选择 Monitoring

    3. (可选) 要按时间筛选结果,请从 Showing data for 中选择时间范围。

    4. 要获得单个指标的一个较大视图,请选择其图形。

  3. 要查看按负载均衡器筛选的指标,请执行以下操作:

    1. 在导航窗格中,选择 Load Balancers

    2. 选择负载均衡器并选择 Monitoring

    3. (可选) 要按时间筛选结果,请从 Showing data for 中选择时间范围。

    4. 要获得单个指标的一个较大视图,请选择其图形。

使用 CloudWatch 控制台查看指标
  1. 打开 CloudWatch 控制台,网址为 https://console.aws.amazon.com/cloudwatch/

  2. 在导航窗格中,选择指标

  3. 选择 NetworkELB 命名空间。

  4. (可选) 要跨所有维度查看某个指标,请在搜索字段中键入其名称。

要查看指标,请使用 AWS CLI

使用以下 list-metrics 命令列出可用指标:

aws cloudwatch list-metrics --namespace AWS/NetworkELB
要获取指标的统计数据,请使用 AWS CLI

使用以下get-metric-statistics命令获取指定指标和维度的统计信息。请注意, CloudWatch 将每个唯一的维度组合视为一个单独的指标。您无法使用未专门发布的维度组合检索统计数据。您必须指定创建指标时使用的同一维度。

aws cloudwatch get-metric-statistics --namespace AWS/NetworkELB \ --metric-name UnHealthyHostCount --statistics Average --period 3600 \ --dimensions Name=LoadBalancer,Value=net/my-load-balancer/50dc6c495c0c9188 \ Name=TargetGroup,Value=targetgroup/my-targets/73e2d6bc24d8a067 \ --start-time 2017-04-18T00:00:00Z --end-time 2017-04-21T00:00:00Z

下面是示例输出:

{ "Datapoints": [ { "Timestamp": "2017-04-18T22:00:00Z", "Average": 0.0, "Unit": "Count" }, { "Timestamp": "2017-04-18T04:00:00Z", "Average": 0.0, "Unit": "Count" }, ... ], "Label": "UnHealthyHostCount" }