Modes de traitement de l'état des cartes - AWS Step Functions

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Modes de traitement de l'état des cartes

Step Functions propose les modes de traitement suivants pour l'Mapétat en fonction de la manière dont vous souhaitez traiter les éléments d'un ensemble de données.

  • Inline — Mode de simultanéité limité. Dans ce mode, chaque itération de l'Mapétat s'exécute dans le contexte du flux de travail qui contient l'Mapétat. Step Functions ajoute l'historique d'exécution de ces itérations à l'historique d'exécution du flux de travail parent. Par défaut, Map les états s'exécutent en mode Inline.

    Dans ce mode, l'MapÉtat accepte uniquement un tableau JSON en entrée. De plus, ce mode prend en charge jusqu'à 40 itérations simultanées.

    Pour plus d'informations, veuillez consulter Utilisation de l'état de la carte en mode Inline.

  • Distribué — Mode de simultanéité élevé. Dans ce mode, l'Mapétat exécute chaque itération en tant qu'exécution d'un flux de travail enfant, ce qui permet une simultanéité élevée de jusqu'à 10 000 exécutions parallèles de flux de travail enfant. Chaque exécution de flux de travail enfant possède son propre historique d'exécution distinct de celui du flux de travail parent.

    Dans ce mode, l'MapÉtat peut accepter un tableau JSON ou une source de données Amazon S3, telle qu'un fichier CSV, comme entrée.

    Pour plus d'informations, veuillez consulter Utilisation de l'état de la carte en mode distribué.

Le mode à utiliser dépend de la manière dont vous souhaitez traiter les éléments d'un ensemble de données. Utilisez l'Mapétat en mode Inline si l'historique d'exécution de votre flux de travail ne doit pas dépasser 25 000 entrées ou si vous n'avez pas besoin de plus de 40 itérations simultanées.

Utilisez l'Mapétat en mode distribué lorsque vous devez orchestrer des charges de travail parallèles à grande échelle répondant à une combinaison des conditions suivantes :

  • La taille de votre jeu de données dépasse 256 Ko.

  • L'historique des événements d'exécution du flux de travail dépasse 25 000 entrées.

  • Vous avez besoin d'une simultanéité de plus de 40 itérations parallèles.

Différences entre le mode en ligne et le mode distribué

Le tableau suivant met en évidence les différences entre les modes en ligne et distribué.

Mode en ligne Mode distribué
Supported data sources

Accepte un tableau JSON transmis depuis une étape précédente du flux de travail en entrée.

Accepte les sources de données suivantes en entrée :

  • Tableau JSON transmis depuis une étape précédente du flux de travail

  • Fichier JSON dans un compartiment Amazon S3 contenant un tableau

  • Fichier CSV dans un compartiment Amazon S3

  • Liste d'objets Amazon S3

  • Inventaire Amazon S3

Map iterations

Dans ce mode, chaque itération de l'Mapétat s'exécute dans le contexte du flux de travail qui contient l'Mapétat. Step Functions ajoute l'historique d'exécution de ces itérations à l'historique d'exécution du flux de travail parent.

Dans ce mode, l'Mapétat exécute chaque itération en tant qu'exécution d'un flux de travail enfant, ce qui permet une simultanéité élevée de jusqu'à 10 000 exécutions parallèles de flux de travail enfant. Chaque exécution de flux de travail enfant possède son propre historique d'exécution distinct de celui du flux de travail parent.

Maximum concurrency for parallel iterations

Permet d'exécuter jusqu'à 40 itérations aussi simultanément que possible.

Vous permet d'exécuter jusqu'à 10 000 exécutions parallèles de flux de travail enfant pour traiter des millions d'éléments de données à la fois.

Input payload and event history sizes

Impose une limite de 256 Ko à la taille de la charge utile d'entrée et à 25 000 entrées dans l'historique des événements d'exécution.

Permet de contourner la limite de taille de la charge utile, car l'MapÉtat peut lire les entrées directement depuis les sources de données Amazon S3.

Dans ce mode, vous pouvez également contourner les limites de l'historique d'exécution, car les exécutions du flux de travail enfant lancées par l'MapÉtat conservent leur propre historique d'exécution distinct de l'historique d'exécution du flux de travail parent.

Monitoring and observability

Vous pouvez consulter l'historique d'exécution du flux de travail depuis la console ou en appelant l'action d'GetExecutionHistoryAPI.

Vous pouvez également consulter l'historique des exécutions via CloudWatch X-Ray.

Lorsque vous exécutez un Map état en mode distribué, Step Functions crée une ressource Map Run. Une exécution de carte fait référence à un ensemble d'exécutions de flux de travail secondaires lancées par un état de carte distribuée. Vous pouvez consulter un Map Run dans la console Step Functions. Vous pouvez également invoquer l'action d'DescribeMapRunAPI. Un Map Run envoie également des métriques à. CloudWatch

Pour plus d'informations, veuillez consulter Examen de l'exécution cartographique d'une exécution de l'état d'une carte distribuée.