Résolution des erreurs d'inférence Neo - Amazon SageMaker

Résolution des erreurs d'inférence Neo

Cette section contient des informations sur la façon de prévenir et de résoudre certaines des erreurs courantes que vous pourriez rencontrer lors du déploiement et/ou de l'appel du point de terminaison. Cette section s'applique à PyTorch 1.4.0 ou version ultérieure et à MXNet v1.7.0 ou ultérieure.

  • Assurez-vous que la première inférence (inférence de préparation) sur des données d'entrée valides est faite dans model_fn(), si vous avez défini un model_fn dans votre script d'inférence ; sinon, le message d'erreur suivant peut s'afficher sur le terminal lorsque l'API predict API est appelée :

    An error occurred (ModelError) when calling the InvokeEndpoint operation: Received server error (0) from <users-sagemaker-endpoint> with message "Your invocation timed out while waiting for a response from container model. Review the latency metrics for each container in Amazon CloudWatch, resolve the issue, and try again."
  • Assurez-vous que les variables d'environnement du tableau suivant sont définies. Si ce n'est pas le cas, le message d'erreur suivant peut s'afficher :

    Sur le terminal:

    An error occurred (ModelError) when calling the InvokeEndpoint operation: Received server error (503) from <users-sagemaker-endpoint> with message "{ "code": 503, "type": "InternalServerException", "message": "Prediction failed" } ".

    Dans CloudWatch:

    W-9001-model-stdout com.amazonaws.ml.mms.wlm.WorkerLifeCycle - AttributeError: 'NoneType' object has no attribute 'transform'
    Key (Clé) Value (Valeur)
    SAGEMAKER_PROGRAM inference.py
    SAGEMAKER_SUBMIT_DIRECTORY /opt/ml/model/code
    SAGEMAKER_CONTAINER_LOG_LEVEL 20
    SAGEMAKER_REGION <your region>
  • Assurez-vous que la variable d'environnement MMS_DEFAULT_RESPONSE_TIMEOUT est définie sur 500 ou une valeur supérieure lors de la création du modèle Amazon SageMaker ; sinon, le message d'erreur suivant peut s'afficher sur le terminal :

    An error occurred (ModelError) when calling the InvokeEndpoint operation: Received server error (0) from <users-sagemaker-endpoint> with message "Your invocation timed out while waiting for a response from container model. Review the latency metrics for each container in Amazon CloudWatch, resolve the issue, and try again."