設定 SageMaker HyperPod 可觀測性附加元件 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定 SageMaker HyperPod 可觀測性附加元件

下列清單說明設定可觀測性附加元件的先決條件。

若要讓 Amazon SageMaker HyperPod (SageMaker HyperPod) 叢集的指標傳送至 Amazon Managed Service for Prometheus 工作區,並選擇性地在 Amazon Managed Grafana 中檢視它們,請先將下列受管政策和許可連接至您的主控台角色。

  • Enable AWS IAM Identity Center (IAM Identity Center) 以使用 Amazon Managed Grafana。如果您的帳戶尚未啟用 IAM Identity Center,請參閱 IAM Identity Center 入門。此外,請在 IAM Identity Center 中建立至少一個使用者。

  • 將下列政策和許可新增至您的角色。

    • AWS 受管政策:AmazonSageMakerHyperPodObservabilityAdminAccess

    • AWS 受管政策:AWSGrafanaWorkspacePermissionManagementV2

    • AWS 受管政策:AmazonSageMakerFullAccess

    • 為 Amazon Managed Grafana 和 Amazon Elastic Kubernetes Service 附加元件存取設定必要 IAM 角色的其他許可:

      { "Version": "2012-10-17", "Statement": [ { "Sid": "CreateRoleAccess", "Effect": "Allow", "Action": [ "iam:CreateRole", "iam:CreatePolicy", "iam:AttachRolePolicy", "iam:ListRoles" ], "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityAddonPolicy*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityGrafanaPolicy*" ] }, { "Sid": "IAMGrafanaPassRoleAccess", "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "Condition": { "StringLike": { "iam:PassedToService": [ "grafana.amazonaws.com" ] } } }, { "Sid": "IAMEKSPassRoleAccess", "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "Condition": { "StringLike": { "iam:PassedToService": [ "pods.eks.amazonaws.com" ] } } }, { "Sid": "IAMGetRoleAccess", "Effect": "Allow", "Action": "iam:GetRole", "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*" ] } ] }
    • 為 Amazon Managed Grafana 管理 IAM Identity Center 使用者所需的其他許可:

      { "Version": "2012-10-17", "Statement": [ { "Sid": "SSOAccess", "Effect": "Allow", "Action": [ "sso:ListProfileAssociations", "sso-directory:SearchUsers", "sso-directory:SearchGroups", "sso:AssociateProfile", "sso:DisassociateProfile" ], "Resource": [ "*" ] } ] }
    • 移除和更新附加元件的 Pod 身分關聯所需的其他許可:

      { "Version": "2012-10-17", "Statement": [ { "Sid": "EKSPodIdentity", "Effect": "Allow", "Action": [ "eks:DeletePodIdentityAssociation", "eks:UpdatePodIdentityAssociation" ], "Resource": "*" } ] }

確定您符合上述先決條件後,即可安裝可觀測性附加元件。

快速安裝可觀測性附加元件
  1. 開啟位於 https://https://console.aws.amazon.com/sagemaker/ 的 Amazon SageMaker AI 主控台。

  2. 前往叢集的詳細資訊頁面。

  3. 儀表板索引標籤上,找到名為 HyperPod 監控和可觀測性的附加元件,然後選擇快速安裝

執行可觀測性附加元件的自訂安裝
  1. 前往叢集的詳細資訊頁面。

  2. 儀表板索引標籤上,找到名為 HyperPod 監控和可觀測性的附加元件,然後選擇自訂安裝

  3. 指定您要查看的指標類別。如需這些指標類別的詳細資訊,請參閱 SageMaker HyperPod 叢集指標

  4. 指定是否要啟用 Amazon CloudWatch Logs。

  5. 指定您是否希望服務建立新的 Amazon Managed Service for Prometheus 工作區。

  6. 若要能夠在 Amazon Managed Grafana 儀表板中檢視指標,請勾選標示為使用 Amazon Managed Grafana 工作區的方塊。您可以指定自己的工作區,或讓服務為您建立新的工作區。

    注意

    Amazon Managed Grafana 不適用於可使用 Amazon Managed Service for Prometheus AWS 區域 的所有 。不過,您可以在任何 中設定 Grafana 工作區, AWS 區域 並將其設定為從位於不同 的 Prometheus 工作區取得指標資料 AWS 區域。如需詳細資訊,請參閱使用 AWS 資料來源組態將 Amazon Managed Service for Prometheus 新增為資料來源,以及連線至 Amazon Managed Service for Prometheus 和開放原始碼 Prometheus 資料來源