监控 AWS Glue 资源 - AWS Glue

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控 AWS Glue 资源

AWS Glue 具有服务限制,可保护客户免受意外过度配置和旨在增加账单的恶意行为的侵害。这些限制还可以保护服务。登录 AWS Service Quota 控制台,客户可以查看其当前的资源限制并请求增加限额(如适用)。

AWS Glue 允许您在 Amazon CloudWatch 中以百分比形式查看服务的资源使用情况,并在其上配置 CloudWatch 警报以监控使用情况。Amazon CloudWatch 提供对在 Amazon 基础设施上运行的 AWS 资源和客户应用程序的监控。您可以免费使用这些指标。支持以下指标:

  • 每个账户的工作流数量

  • 每个账户的触发器数

  • 每个账户的任务数

  • 每个账户的并发作业运行数

  • 每个账户的蓝图数量

  • 每个账户的互动会话次数

配置和使用资源指标

要使用此功能,您可以前往 Amazon CloudWatch 控制台查看指标并配置警报。这些指标位于 AWS/Glue 命名空间下,是实际资源使用计数除以资源限额的百分比。CloudWatch 指标将发送到您的账户,这对您来说是免费的。例如,如果您创建了 10 个工作流程,并且您的服务限额允许最多拥有 200 个工作流程,则您的使用量为 10/200 = 5%,在图表中,您将看到一个百分比为 5 的数据点。更具体地说:

Namespace: AWS/Glue Metric name: ResourceUsage Type: Resource Resource: Workflow (or Trigger, Job, JobRun, Blueprint, InteractiveSession) Service: Glue Class: None
资源指标

在 CloudWatch 控制台中针对指标创建警报

  1. 找到指标后,转到绘成图表的指标

  2. 单击操作下的创建警报

  3. 根据需要配置警报。

每当您的资源使用量发生变化(例如增加或减少)时,我们都会发布指标。但是,如果您的资源使用量没有变化,我们会每小时发布一次指标,这样您就可以获得连续的 CloudWatch 图表。为避免丢失数据点,我们建议您不要配置少于 1 小时的时间段。

您也可以使用 AWS CloudFormation 配置警报,如以下示例所示。在本例中,一旦工作流程资源使用量达到 80%,就会触发警报,向现有 SNS 主题发送消息,您可以订阅该主题以获取通知。

{ "Type": "AWS::CloudWatch::Alarm", "Properties": { "AlarmName": "WorkflowUsageAlarm", "ActionsEnabled": true, "OKActions": [], "AlarmActions": [ "arn:aws:sns:af-south-1:085425700061:Default_CloudWatch_Alarms_Topic" ], "InsufficientDataActions": [], "MetricName": "ResourceUsage", "Namespace": "AWS/Glue", "Statistic": "Maximum", "Dimensions": [{ "Name": "Type", "Value": "Resource" }, { "Name": "Resource", "Value": "Workflow" }, { "Name": "Service", "Value": "Glue" }, { "Name": "Class", "Value": "None" } ], "Period": 3600, "EvaluationPeriods": 1, "DatapointsToAlarm": 1, "Threshold": 80, "ComparisonOperator": "GreaterThanThreshold", "TreatMissingData": "notBreaching" } }