本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
設定 SageMaker HyperPod 可觀測性附加元件
下列清單說明設定可觀測性附加元件的先決條件。
若要讓 Amazon SageMaker HyperPod (SageMaker HyperPod) 叢集的指標傳送至 Amazon Managed Service for Prometheus 工作區,並選擇性地在 Amazon Managed Grafana 中檢視它們,請先將下列受管政策和許可連接至您的主控台角色。
-
Enable AWS IAM Identity Center (IAM Identity Center) 以使用 Amazon Managed Grafana。如果您的帳戶尚未啟用 IAM Identity Center,請參閱 IAM Identity Center 入門。此外,請在 IAM Identity Center 中建立至少一個使用者。
-
將下列政策和許可新增至您的角色。
-
為 Amazon Managed Grafana 和 Amazon Elastic Kubernetes Service 附加元件存取設定必要 IAM 角色的其他許可:
{ "Version": "2012-10-17", "Statement": [ { "Sid": "CreateRoleAccess", "Effect": "Allow", "Action": [ "iam:CreateRole", "iam:CreatePolicy", "iam:AttachRolePolicy", "iam:ListRoles" ], "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityAddonPolicy*", "arn:aws:iam::*:policy/service-role/HyperPodObservabilityGrafanaPolicy*" ] }, { "Sid": "IAMGrafanaPassRoleAccess", "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityGrafanaAccess*", "Condition": { "StringLike": { "iam:PassedToService": [ "grafana.amazonaws.com" ] } } }, { "Sid": "IAMEKSPassRoleAccess", "Effect": "Allow", "Action": [ "iam:PassRole" ], "Resource": "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*", "Condition": { "StringLike": { "iam:PassedToService": [ "pods.eks.amazonaws.com" ] } } }, { "Sid": "IAMGetRoleAccess", "Effect": "Allow", "Action": "iam:GetRole", "Resource": [ "arn:aws:iam::*:role/service-role/AmazonSageMakerHyperPodObservabilityAddonAccess*" ] } ] }
-
為 Amazon Managed Grafana 管理 IAM Identity Center 使用者所需的其他許可:
{ "Version": "2012-10-17", "Statement": [ { "Sid": "SSOAccess", "Effect": "Allow", "Action": [ "sso:ListProfileAssociations", "sso-directory:SearchUsers", "sso-directory:SearchGroups", "sso:AssociateProfile", "sso:DisassociateProfile" ], "Resource": [ "*" ] } ] }
-
移除和更新附加元件的 Pod 身分關聯所需的其他許可:
{ "Version": "2012-10-17", "Statement": [ { "Sid": "EKSPodIdentity", "Effect": "Allow", "Action": [ "eks:DeletePodIdentityAssociation", "eks:UpdatePodIdentityAssociation" ], "Resource": "*" } ] }
確定您符合上述先決條件後,即可安裝可觀測性附加元件。
快速安裝可觀測性附加元件
開啟位於 https://https://console.aws.amazon.com/sagemaker/
的 Amazon SageMaker AI 主控台。 -
前往叢集的詳細資訊頁面。
-
在儀表板索引標籤上,找到名為 HyperPod 監控和可觀測性的附加元件,然後選擇快速安裝。
執行可觀測性附加元件的自訂安裝
-
前往叢集的詳細資訊頁面。
-
在儀表板索引標籤上,找到名為 HyperPod 監控和可觀測性的附加元件,然後選擇自訂安裝。
-
指定您要查看的指標類別。如需這些指標類別的詳細資訊,請參閱 SageMaker HyperPod 叢集指標。
-
指定是否要啟用 Amazon CloudWatch Logs。
-
指定您是否希望服務建立新的 Amazon Managed Service for Prometheus 工作區。
-
若要能夠在 Amazon Managed Grafana 儀表板中檢視指標,請勾選標示為使用 Amazon Managed Grafana 工作區的方塊。您可以指定自己的工作區,或讓服務為您建立新的工作區。
注意
Amazon Managed Grafana 不適用於可使用 Amazon Managed Service for Prometheus AWS 區域 的所有 。不過,您可以在任何 中設定 Grafana 工作區, AWS 區域 並將其設定為從位於不同 的 Prometheus 工作區取得指標資料 AWS 區域。如需詳細資訊,請參閱使用 AWS 資料來源組態將 Amazon Managed Service for Prometheus 新增為資料來源,以及連線至 Amazon Managed Service for Prometheus 和開放原始碼 Prometheus 資料來源。