Résolvez des erreurs - Amazon SageMaker

Résolvez des erreurs

Cette section contient des informations sur la façon de comprendre et d'éviter les erreurs courantes, les messages d'erreur qu'elles génèrent, ainsi que des conseils sur la manière de résoudre ces erreurs. Avant d'aller plus loin, posez-vous les questions suivantes :

Avez-vous rencontré une erreur avant de déployer votre modèle? Si oui, veuillez consulter Troubleshoot Neo Compilation Errors (Résolution des erreurs de compilation Neo).

Avez-vous rencontré une erreur après avoir compilé votre modèle? Si oui, veuillez consulter Troubleshoot Neo Inference Errors (Résolution des erreurs d'inférence Neo).

Avez-vous rencontré une erreur lors de la compilation de votre modèle pour des périphériques Ambarella? Si oui, veuillez consulter Résolution des erreurs Ambarella.

Classification des types d'erreurs

Cette liste classifie à les erreurs de l'utilisateur que vous pouvez recevoir de Neo. Elles incluent les erreurs d'accès et d'autorisation ainsi que les erreurs de chargement pour chacune des infrastructures prises en charge. Toutes les autres erreurs sont des erreurs de système.

Neo transmet les erreurs directement depuis le service dépendant.

  • Accès refusé lors de l'appel sts:AssumeRole

  • Toute erreur 400 lors de l'appel d'Amazon S3 pour télécharger un modèle client vers l'amont ou l'aval

  • Erreur PassRole

En supposant que le compilateur Neo a chargé .tar.gz avec succès depuis Amazon S3, vérifiez que le tarball contient les fichiers nécessaires pour la compilation. Le critère de vérification est propre à l'infrastructure :

  • TensorFlow : Attend uniquement un fichier protobuf (*.pb ou *.pbtxt). Pour les modèles enregistrés, attend un dossier de variables.

  • Pytorch : Attend uniquement un fichier pytorch (*.pth).

  • MXNET : Attend uniquement un fichier de symboles (*.json) et un fichier de paramètres (*.params).

  • XGBoost : Attend uniquement un fichier de modèles XGBoost (*.model). Le modèle d'entrée dispose d'une limite de taille.

En supposant que le compilateur Neo a chargé .tar.gz avec succès depuis Amazon S3, et que le tarball contient les fichiers nécessaires pour la compilation. Le critère de vérification est :

  • OperatorNotImplemented : Un opérateur n'a pas été implémenté.

  • OperatorAttributeNotImplemented : L'attribut de l'opérateur spécifié n'a pas été implémenté.

  • OperatorAttributeRequired : Un attribut est requis pour un graphique de symboles interne, mais il n'est pas répertorié dans le graphique du modèle d'entrée de l'utilisateur.

  • OperatorAttributeValueNotValid : La valeur de l'attribut dans l'opérateur spécifique n'est pas valide.