Compilation d'un modèle (SDK Amazon SageMaker) - Amazon SageMaker

Compilation d'un modèle (SDK Amazon SageMaker)

Vous pouvez utiliser l'API compile_model dans le Kit SDK Amazon SageMaker pour Python pour compiler un modèle entraîné et l'optimiser pour un matériel cible spécifique. L'API doit être appelée sur l'objet estimateur utilisé pendant l'entraînement du modèle.

Note

Vous devez définir la variable d'environnement MMS_DEFAULT_RESPONSE_TIMEOUT sur 500 lors de la compilation du modèle avec MxNet ou PyTorch. La variable d'environnement n'est pas nécessaire avec TensorFlow.

Voici un exemple de la façon dont vous pouvez compiler un modèle à l'aide de l'objet trained_model_estimator :

# Replace the value of expected_trained_model_input below and # specify the name & shape of the expected inputs for your trained model # in json dictionary form expected_trained_model_input = {'data':[1, 784]} # Replace the example target_instance_family below to your preferred target_instance_family compiled_model = trained_model_estimator.compile_model(target_instance_family='ml_c5', input_shape=expected_trained_model_input, output_path='insert s3 output path', env={'MMS_DEFAULT_RESPONSE_TIMEOUT': '500'})

Le code compile le modèle, enregistre le modèle optimisé dans output_path et crée un modèle SageMaker pouvant être déployé sur un point de terminaison. Des exemples de blocs-notes d'utilisation du SDK pour Python sont fournis dans la section Neo Model Compilation Sample Notebooks (Exemples de blocs-notes de compilation de modèles Neo).