Exécution des conteneurs d'entraînement et d'inférence sans accès Internet - Amazon SageMaker

Exécution des conteneurs d'entraînement et d'inférence sans accès Internet

Les conteneurs d'entraînement et d'inférence déployés SageMaker accèdent à Internet par défaut. Ils peuvent ainsi accéder aux services et ressources externes sur l'Internet public dans le cadre de vos charges de travail d'entraînement et d'inférence. Cependant, une voie peut ainsi être ouverte pour l'accès non autorisé à vos données. Par exemple, un utilisateur ou un code malveillant que vous installez accidentellement sur le conteneur (sous la forme d'une bibliothèque de code source accessible au public) peut accéder à vos données et les transférer à un hôte distant.

Si vous utilisez un Amazon VPC en spécifiant une valeur pour le paramètre VpcConfig lorsque vous appelez CreateTrainingJob, CreateHyperParameterTuningJob ou CreateModel, vous pouvez protéger vos données et vos ressources en gérant les groupes de sécurité et en restreignant l'accès Internet à partir de votre VPC. Cependant, c'est au prix d'une configuration réseau supplémentaire et d'un risque de configuration incorrecte de votre réseau. Si vous ne souhaitez pas que SageMaker fournisse un accès réseau externe à vos conteneurs d'entraînement ou d'inférence, vous pouvez activer l'isolement de réseau.

Isolement du réseau

Vous pouvez activer l'isolement de réseau lorsque vous créez votre tâche ou votre modèle d'entraînement en définissant la valeur du paramètre EnableNetworkIsolation sur True lorsque vous appelez CreateTrainingJob, CreateHyperParameterTuningJob ou CreateModel.

Note

L'isolement réseau est requis pour exécuter les tâches d'entraînement et les modèles exécutés à l'aide des ressources de AWS Marketplace.

Si vous activez l'isolement réseau, les conteneurs ne peuvent pas effectuer d'appels réseau sortants, même à d'autres services AWS tels qu'Amazon S3. En outre, aucune information d'identification AWS n'est mise à la disposition de l'environnement d'exécution du conteneur. Dans le cas d'une tâche d'entraînement avec plusieurs instances, le trafic réseau entrant et sortant se limite aux pairs de chaque conteneur d'entraînement. SageMaker effectue toujours des opérations de téléchargement sur Amazon S3 à l'aide de votre rôle d'exécution SageMaker isolé du conteneur d'entraînement ou d'inférence.

L'isolement réseau n'est pas pris en charge par les conteneurs SageMaker gérés ci-après, car ils ont besoin d'accéder à Amazon S3 :

  • Chainer

  • Apprentissage par renforcement SageMaker

Isolement réseau avec un VPC

L'isolement réseau peut être utilisé en association avec un VPC. Dans ce scénario, le téléchargement des données client et des artefacts de modèle sont acheminés via votre sous-réseau VPC. Les conteneurs d'entraînement et d'inférence restent toutefois isolés du réseau et n'ont pas accès aux ressource de votre VPC ou sur Internet.