Modes de débit - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Modes de débit

Amazon SageMaker Feature Store propose deux modèles de tarification parmi lesquels choisir : les modes de débit à la demande (On-demand) et provisionné (Provisioned). On-demandfonctionne mieux pour un trafic moins prévisible, tout en Provisioned fonctionnant mieux pour un trafic constant et prévisible.

Vous avez la possibilité de basculer entre les modes On-demand et les modes de Provisioned débit pour un groupe de fonctionnalités donné, afin de vous adapter aux périodes pendant lesquelles les modèles de trafic des applications changent ou sont moins prévisibles. Vous ne pouvez mettre à jour le mode de débit de votre groupe de fonctionnalités On-demand qu'une fois par période de 24 heures. Le mode de débit peut être mis à jour par programmation à l'aide de l'interface utilisateur de la UpdateFeatureGroupAPIconsole ou via celle-ci. Pour plus d'informations sur l'utilisation de la console, consultez Utilisation d'Amazon SageMaker Feature Store dans la console.

Vous pouvez utiliser le mode Provisioned débit avec des groupes de fonctionnalités uniquement hors ligne ou des groupes de fonctionnalités avec le type de stockage. Standard Pour les autres configurations de stockage, le mode On-demand débit est utilisé. Pour plus d'informations sur les configurations de stockage en ligne et hors ligne, voir Le magasin en ligne etLe magasin hors connexion, respectivement.

Pour plus d'informations sur les tarifs, consultez Amazon SageMaker Pricing.

Mode de débit à la demande

Le mode débit On-demand (par défaut) fonctionne mieux lorsque vous utilisez des groupes de fonctionnalités dont la charge de travail est inconnue, que le trafic d'applications est imprévisible et que vous ne pouvez pas prévoir les besoins en capacité.

Le On-demand mode vous facture les lectures et les écritures effectuées par votre application sur vos groupes de fonctionnalités. Il n'est pas nécessaire de spécifier le débit de lecture et d'écriture que vous souhaitez que votre application atteigne, car Feature Store s'adapte instantanément à vos charges de travail à mesure qu'elles augmentent ou diminuent. Vous ne payez que pour ce que vous utilisez, qui est mesuré en ReadRequestsUnits etWriteRequestsUnits.

Vous pouvez activer le mode On-demand débit à l'aide de CreateFeatureGroupUpdateFeatureGroupAPIsou via l'interface utilisateur de la console. Pour plus d'informations sur l'utilisation de l'interface utilisateur de la console, consultezUtilisation d'Amazon SageMaker Feature Store dans la console.

Important

Vous ne pouvez mettre à jour le mode de débit de votre groupe de fonctionnalités On-demand qu'une fois par période de 24 heures.

Mode de débit provisionné

Le mode Provisioned débit fonctionne mieux lorsque vous utilisez des groupes de fonctionnalités dont les charges de travail sont prévisibles et que vous pouvez prévoir les besoins en capacité pour contrôler les coûts. Cela peut le rendre plus rentable pour certaines charges de travail pour lesquelles vous pouvez anticiper les exigences de débit à l'avance.

Lorsque vous définissez un groupe de fonctionnalités en Provisioned mode, vous spécifiez des unités de capacité qui sont la quantité maximale de capacité qu'une application peut consommer à partir d'un groupe de fonctionnalités. Si votre application dépasse cette capacité de Provisioned débit, elle est soumise à une limitation des demandes.

Vous trouverez ci-dessous des informations sur les unités de capacité de lecture et d'écriture.

  • La récupération d'un seul enregistrement d'une taille maximale de 4 Ko à l'aide du en GetRecord API consommera au moins 1 RCU (unité de capacité de lecture). La récupération de charges utiles plus importantes peut prendre plus de temps. Le nombre total d'unités de capacité de lecture requises dépend de la taille de l'élément, y compris de petites métadonnées par enregistrement ajoutées par le service Feature Store.

  • Une seule demande d'écriture avec une charge utile de 1 Ko utilisant le PutRecord API consommera au moins 1 WCU (unité de capacité d'écriture), les charges utiles fractionnaires étant arrondies au Ko le plus proche. Il peut en consommer davantage en fonction de l'heure de l'événement, de l'état de suppression de l'enregistrement et du statut time to live (TTL). Pour plus d'informations surTTL, voirDurée de vie (TTL) pour les enregistrements.

Important

Lorsque vous définissez vos unités de capacité, tenez compte des points suivants :

  • Les capacités de lecture et d'écriture que vous fournissez pour votre groupe de fonctionnalités vous seront facturées, même si vous n'utilisez pas pleinement ces Provisioned capacités.

  • Si vous définissez une capacité de lecture ou d'écriture trop faible, vos demandes peuvent être limitées.

  • Dans certains cas, les enregistrements peuvent consommer une unité de capacité supplémentaire en raison des métadonnées au niveau des enregistrements ajoutées par le service Feature Store pour activer diverses fonctionnalités.

  • Récupération d'un sous-ensemble de fonctionnalités uniquement en utilisant GetRecord ou BatchGetRecord APIs consommant toujours l'RCUintégralité de l'enregistrement.

  • Pour ce qui est de la capacité d'écriture, vous devez fournir deux fois la capacité maximale récente afin d'éviter toute limitation lors du remblayage ou une ingestion massive susceptible d'entraîner un grand nombre d'écritures d'enregistrements historiques. Cela est dû au fait que l'écriture d'enregistrements historiques consomme de la capacité d'écriture supplémentaire.

  • Le Feature Store ne prend actuellement pas en charge le dimensionnement automatique pour Provisioned le mode.

Vous pouvez activer le mode On-demand débit à l'aide de CreateFeatureGroupUpdateFeatureGroupAPIsou via l'interface utilisateur de la console. Pour plus d'informations sur l'utilisation de l'interface utilisateur de la console, consultezUtilisation d'Amazon SageMaker Feature Store dans la console.

Ce qui suit décrit comment augmenter ou diminuer le WCU débit RCU et le débit de vos groupes de fonctionnalités lorsque le Provisioned mode est activé.

Augmenter le débit provisionné

Vous pouvez augmenter RCU ou WCU aussi souvent que nécessaire à l'aide de l'interface utilisateur UpdateFeatureGroupAPIou de la console.

Diminution du débit provisionné

Vous pouvez diminuer RCU et WCU (ou les deux) pour les groupes de fonctionnalités à l'aide UpdateFeatureGroupAPIde l'interface utilisateur de la console.

Il existe un quota par défaut quant au nombre de diminutions de Provisioned capacité que vous pouvez effectuer sur votre groupe de fonctionnalités par jour. Un jour est défini selon le temps universel coordonné (UTC). Un jour donné, vous pouvez commencer par effectuer jusqu'à quatre diminutions en une heure tant que vous n'avez pas encore effectué d'autres diminutions durant cette journée. Par la suite, vous pouvez effectuer une réduction supplémentaire par heure tant qu'il n'y a pas eu de diminution au cours de l'heure précédente. Cela porte effectivement le nombre maximum de réductions par jour à 27 (4 réductions durant la première heure, et 1 réduction pour chacune des 23 fenêtres de 1 heure suivantes).

Métriques du mode débit

Un groupe de fonctionnalités en On-demand mode émettra ConsumedReadRequestsUnits des ConsumedWriteRequestsUnits métriques. Un groupe de fonctionnalités en Provisioned mode émettra ConsumedReadCapacityUnits des ConsumedWriteCapacityUnits métriques. Pour plus d'informations sur les statistiques du Feature Store, consultezStatistiques de l'Amazon SageMaker Feature Store.

Limites du mode débit

Chacun d'entre eux Compte AWS comporte des quotas ou des limites de service par défaut qui sont appliqués pour garantir la disponibilité et gérer les risques liés à la facturation. Pour plus d'informations sur les quotas et les limites par défaut, consultezQuotas, règles de dénomination et types de données.

Dans certains cas, ces limites peuvent être inférieures à celles indiquées dans la documentation. Si vous avez besoin de limites plus élevées, vous pouvez soumettre une demande d'augmentation. C'est une bonne idée de le faire avant d'atteindre les limites actuelles afin d'éviter toute interruption de travail. Pour plus d'informations sur les quotas de service et sur la manière de demander une augmentation de quota, consultez la section Quotas AWS de service.