Points de terminaison multi-conteneurs

SageMaker Les points de terminaison multi-conteneurs basés sur l'IA permettent aux clients de déployer plusieurs conteneurs, qui utilisent différents modèles ou frameworks, sur un seul point de terminaison d' SageMaker IA. Les conteneurs peuvent être exécutés en séquence en tant que pipeline d'inférence, ou être appelés directement pour un accès individuel afin d'améliorer l'utilisation du point de terminaison et optimiser les coûts.

Pour obtenir des informations sur l'appel des conteneurs dans un point de terminaison multi-conteneurs en séquence, veuillez consulter Pipelines d'inférence dans Amazon AI SageMaker .

Pour obtenir des informations sur l'appel d'un conteneur spécifique dans un point de terminaison multi-conteneurs, veuillez consulter Appel d'un point de terminaison multi-conteneurs avec appel direct

Rubriques

La politique suivante autorise les demandes invoke_endpoint uniquement lorsque la valeur du champ TargetContainerHostname correspond à l'une des expressions régulières spécifiées.

La politique suivante refuse les demandes invoke_endpoint lorsque la valeur du champ TargetContainerHostname correspond à l'une des expressions régulières spécifiées dans l'énoncé Deny.

Pour plus d'informations sur les clés de condition SageMaker AI, voir Clés de condition pour SageMaker IA dans le guide de AWS Identity and Access Management l'utilisateur.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Définition de politiques Auto Scaling pour les déploiements de points de terminaison multi-modèles

Pour créer un point de terminaison multi-conteneurs (Boto 3)