Beheben von Problemen mit Inferenz-Pipelines - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Beheben von Problemen mit Inferenz-Pipelines

Zur Behebung von Problemen mit Inferenz-Pipeline:benutzen CloudWatch Protokolle und Fehlermeldung-Geräte. Wenn Sie benutzerdefinierte Docker-Images in einer Pipeline verwenden, die Amazon enthält SageMaker Bei integrierten Algorithmen können auch Berechtigungsprobleme auftreten. Zum Erteilen der erforderlichen Berechtigungen erstellen Sie eine Amazon Elastic Container Registry (Amazon ECR) -Richtlinie.

Beheben von Problemen mit Amazon ECR-Berechtigungen für Inferenz-Pipelines

Wenn Sie benutzerdefinierte Docker-Abbilder in einer Pipeline verwenden, die enthältSageMaker integrierte -Algorithmenbenötigen SieeinAmazon ECR-Richtlinieaus. Die Richtlinie erlaubt Ihrem Amazon ECR-Repository, die Erlaubnis zu erteilen SageMaker um das Bild zu ziehen. Die Richtlinie muss die folgenden Berechtigungen hinzufügen:

{ "Version": "2008-10-17", "Statement": [ { "Sid": "allowSageMakerToPull", "Effect": "Allow", "Principal": { "Service": "sagemaker.amazonaws.com" }, "Action": [ "ecr:GetDownloadUrlForLayer", "ecr:BatchGetImage", "ecr:BatchCheckLayerAvailability" ] } ] }

Verwenden von CloudWatch Protokolle zur Fehlerbehebung SageMaker Inferenz-Pipelines

SageMaker veröffentlicht die Container-Protokolle für Endpunkte, die eine Inferenz-Pipeline für Amazon bereitstellen CloudWatch im folgenden Pfad für jeden Container.

/aws/sagemaker/Endpoints/{EndpointName}/{Variant}/{InstanceId}/{ContainerHostname}

Beispiel: Protokolle für diesen Endpunkt werden in den folgenden Protokollgruppen und Streams veröffentlicht:

EndpointName: MyInferencePipelinesEndpoint Variant: MyInferencePipelinesVariant InstanceId: i-0179208609ff7e488 ContainerHostname: MyContainerName1 and MyContainerName2
logGroup: /aws/sagemaker/Endpoints/MyInferencePipelinesEndpoint logStream: MyInferencePipelinesVariant/i-0179208609ff7e488/MyContainerName1 logStream: MyInferencePipelinesVariant/i-0179208609ff7e488/MyContainerName2

EINProtokollstreamist eine Abfolge von Protokollereignissen, die dieselbe Quelle verwenden. Jede separate Quelle für Protokolle in CloudWatch bildet einen separaten Protokollstream. Eine Protokollgruppe ist eine Gruppe von Protokollstreams, die dieselben Einstellungen für die Aufbewahrung, Überwachung und Zugriffskontrolle besitzen.

Anzeigen der Protokollgruppen und -streams

  1. Öffnen Sie CloudWatch -Konsole beihttps://console.aws.amazon.com/cloudwatch/aus.

  2. Wählen Sie auf der Navigationsseite Logs (Protokolle).

  3. Filtern Sie unter Log Groups (Protokollgruppen) nach MyInferencePipelinesEndpoint:

    
                            Die CloudWatch Nach Inferenz-Pipeline-Endpunkt gefilterte Protokollgruppen.
  4. Um die Protokoll-Streams anzuzeigen, finden Sie im CloudWatch -Protokollgruppen-Seite wählenMyInferencePipelinesEndpoint, und dannSearch Log Groupaus.

    
                            Die CloudWatch Protokollstream für die Inferenz-Pipeline.

Für eine Liste der Protokolle, die SageMaker veröffentlicht, sieheInferenz-Pipeline-Protokolle und -Metrikenaus.

Verwenden von Fehlermeldungen zum Beheben von Problemen mit Inferenz-Pipelines.

Die Inferenz-Pipeline-Fehlermeldungen geben an, welcher Container fehlgeschlagen ist.

Wenn während eines Fehlers auftritt SageMaker ruft einen Endpunkt auf, der Dienst gibt eineModelError(Fehlercode 424), was anzeigt, welcher Container fehlgeschlagen ist. Wenn die Anfragenutzlast (die Antwort des vorherigen Containers) den Grenzwert von 5 MB überschreitet, SageMaker liefert eine detaillierte Fehlermeldung wie:

Received response from MyContainerName1 with status code 200. However, the request payload from MyContainerName1 to MyContainerName2 is 6000000 bytes, which has exceeded the maximum limit of 5 MB.

Wenn ein Container fehlschlägt die Ping-Integritätsprüfung während SageMaker erstellt einen Endpunkt, er gibt einenClientErrorund zeigt alle Container an, die die Ping-Prüfung bei der letzten Zustandsprüfung nicht bestanden haben.