Connexion des blocs-notes SageMaker Studio aux ressources d'un VPC - Amazon SageMaker

Connexion des blocs-notes SageMaker Studio aux ressources d'un VPC

La rubrique suivante fournit des informations sur la connexion des blocs-notes Studio aux ressources d'un VPC.

Communication par défaut avec Internet

Par défaut, SageMaker Studio fournit une interface réseau qui permet de communiquer avec Internet via un VPC géré par SageMaker. Le trafic vers des services AWS tels qu'Amazon S3 et CloudWatch passe par une passerelle Internet, tout comme le trafic qui accède à l'API SageMaker et à l'exécution SageMaker. Le trafic entre le domaine et votre volume Amazon EFS passe par le VPC que vous avez spécifié lors de votre onboarding à Studio ou de votre appel de l'API CreateDomain. Le schéma suivant illustre la configuration par défaut.


                    Schéma de SageMaker Studio VPC utilisant un accès direct à Internet

VPC onlyCommunication avec Internet

Pour empêcher SageMaker de fournir un accès Internet à vos blocs-notes Studio, vous pouvez désactiver l'accès à Internet en spécifiant le type d'accès réseau VPC only lorsque de l'onboarding sur Studio de l'appel de l'API CreateDomain. Dès lors, vous ne pourrez pas exécuter un bloc-notes Studio, sauf si votre VPC dispose d'un point de terminaison d'interface vers l'API et l'exécution SageMaker ou une passerelle NAT avec accès Internet et que vos groupes de sécurité autorisent les connexions sortantes. Le diagramme suivant montre une configuration pour utiliser le mode VPC uniquement.


                    Diagramme du VPC SageMaker Studio utilisant le mode VPC uniquement

Exigences pour utiliser le mode VPC only

Si vous avez choisi VpcOnly, procédez comme suit :

  1. Assurez-vous que vos sous-réseaux ont une adresse IP pour chaque instance. Pour plus d'informations, veuillez consulter Dimensionnement des VPC et des sous-réseaux pour IPv4.

    Note

    Vous pouvez uniquement configurer des sous-réseaux avec un VPC de location par défaut dans lequel votre instance s'exécute sur un matériel partagé. Pour de plus amples informations sur l'attribut de location pour les VPC, veuillez consulter Instances dédiées.

  2. Configurez un ou plusieurs groupes de sécurité avec des règles entrantes et sortantes qui, ensemble, autorisent le trafic suivant :

  3. Si vous souhaitez autoriser l'accès à Internet, vous devez utiliser une passerelle NAT avec accès Internet, par exemple via une passerelle Internet.

  4. Si vous ne souhaitez pas autoriser l'accès à Internet, créez des points de terminaison de VPC d'interface (AWSPrivateLink) pour permettre à Studio d'accéder aux services suivants avec les noms de service correspondants. Vous devez également associer les groupes de sécurité pour votre VPC à ces points de terminaison.

    • API SageMaker : : com.amazonaws.us-east-1.sagemaker.api

    • Exécution SageMaker : com.amazonaws.us-east-1.sagemaker.runtime. Ceci est nécessaire pour exécuter des blocs-notes Studio et pour entraîner et héberger des modèles.

    • Amazon S3: com.amazonaws.us-east-1.s3.

    • Pour utiliser SageMaker Projects : com.amazonaws.us-east-1.servicecatalog.

    • Tout autre service AWS dont vous avez besoin.

Note

Pour un client travaillant en mode VPC, les pare-feu d'entreprise peuvent provoquer des problèmes de connexion avec SageMaker Studio ou entre JupyterServer et KernelGateway. Effectuez les vérifications suivantes si vous rencontrez l'un de ces problèmes lorsque vous utilisez SageMaker Studio derrière un pare-feu.

  • Vérifiez que l'URL de Studio est dans votre liste d'autorisations de réseaux.

  • Vérifiez que les connexions WebSocket ne sont pas bloquées. Jupyter utilise WebSocket en arrière-plan. Si l'application KernelGateway est InService, JupyterServer peut ne pas être en mesure de se connecter à KernelGateway. Vous devriez voir ce problème également lors de l'ouverture du terminal système.