監控 AWS Glue - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

監控 AWS Glue

監控對於維護 AWS Glue 及其他 AWS 解決方案的可靠性、可用性和效能至關重要。AWS 提供監控工具,可讓您監看 AWS Glue、在發現錯誤時回報,並適時自動採取動作:

您可以使用下列自動化監控工具來監看 AWS Glue,並在發生錯誤時進行回報:

  • Amazon CloudWatch Events 會提供近乎即時的系統事件串流,說明 AWS 資源的變動情形。CloudWatch Events 能自動化執行事件導向型運算。您可以編寫規則,在其他 AWS 服務內監看特定事件,並在這些事件發生時觸發自動化動作。如需詳細資訊,請參閱 Amazon CloudWatch Events 使用者指南

  • Amazon CloudWatch Logs 可讓您監控、存放及存取來自 Amazon EC2 執行個體、AWS CloudTrail 或其他來源的日誌檔案。CloudWatch Logs 可監控日誌檔內的資訊,並在滿足特定閾值時向您發出通知。您也可以將日誌資料存檔在高耐用性的儲存空間。如需詳細資訊,請參閱 Amazon CloudWatch Logs 使用者指南

  • AWS CloudTrail 可擷取 AWS 帳戶發出或代表發出的 API 呼叫和相關事件,並傳送日誌檔案至您指定的 Amazon S3 儲存貯體。您可以找出呼叫 AWS 的使用者和帳戶、發出呼叫的來源 IP 地址,以及呼叫的發生時間。如需詳細資訊,請參閱《AWS CloudTrail 使用者指南》。

此外,也可以存取 AWS Glue 主控台中的下列深入解析,以協助您針對工作進行偵錯和分析:

  • Spark 工作 – 您可以看到所選 CloudWatch 指標系列的視覺化,而較新的工作可以存取 Spark UI。如需更多詳細資訊,請參閱 監控 AWS Glue Spark 任務

  • Ray 工作 – 您可以看到所選 CloudWatch 指標系列的視覺化。如需更多詳細資訊,請參閱 使用指標監控 Ray 任務