Scalabilité automatique des modèles Amazon SageMaker
Amazon SageMaker prend en charge la mise à l'échelle automatique pour vos modèles hébergés. La mise à l'échelle automatique ajuste dynamiquement le nombre d'instances allouées pour un modèle en réponse à des modifications de la charge de travail. Lorsque la charge de travail augmente, la mise à l'échelle automatique met en ligne plus d'instances. Lorsque la charge de travail diminue, la mise à l'échelle automatique supprime les instances inutiles pour que vous n'ayez pas à payer les instances allouées que vous n'utilisez pas.
Rubriques
- Prérequis
- Configuration de la mise à l'échelle automatique d'un modèle avec la console
- Enregistrement d'un modèle
- Définition d'une stratégie de mise à l'échelle
- Application d'une stratégie de mise à l'échelle
- Modification d'une stratégie de mise à l'échelle
- Suppression d'une stratégie de mise à l'échelle
- Interrogation de l'historique de mise à l'échelle automatique des points de terminaison
- Mise à jour ou suppression des points de terminaison qui utilisent la mise à l'échelle automatique
- Test de charge de votre configuration de mise à l'échelle automatique
- Utilisation d'AWS CloudFormation pour créer des politiques de mise à l'échelle