Scalabilité automatique des modèles Amazon SageMaker
Amazon SageMaker prend en charge la scalabilité automatique (scalabilité automatique) pour vos modèles hébergés. La mise à l'échelle automatique ajuste dynamiquement le nombre d'instances allouées pour un modèle en réponse aux modifications de la charge de travail. Lorsque la charge de travail augmente, la mise à l'échelle automatique met en ligne plus d'instances. Lorsque la charge de travail diminue, la mise à l'échelle automatique supprime les instances inutiles pour que vous n'ayez pas à payer des instances allouées que vous n'utilisez pas.
Rubriques
- Prérequis
- Configuration de la mise à l'échelle automatique d'un modèle avec la console
- Enregistrement d'un modèle
- Définition d'une stratégie de mise à l'échelle
- Application d'une stratégie de mise à l'échelle
- Modification d'une stratégie de mise à l'échelle
- Suppression d'une stratégie de mise à l'échelle
- Interrogation de l'historique de scalabilité automatique des points de terminaison
- Mise à jour ou suppression des points de terminaison qui utilisent la mise à l'échelle automatique
- Test de charge de votre configuration de mise à l'échelle automatique
- Utiliser AWS CloudFormation pour mettre à jour les stratégies de mise à l'échelle automatique