Différences entre le mode en ligne et le mode distribué

Modes de traitement de l'état des cartes

Step Functions propose les modes de traitement suivants pour l'Mapétat en fonction de la manière dont vous souhaitez traiter les éléments d'un ensemble de données.

Inline — Mode de simultanéité limité. Dans ce mode, chaque itération de l'Mapétat s'exécute dans le contexte du flux de travail qui contient l'Mapétat. Step Functions ajoute l'historique d'exécution de ces itérations à l'historique d'exécution du flux de travail parent. Par défaut, Map les états s'exécutent en mode Inline.

Dans ce mode, l'MapÉtat accepte uniquement un tableau JSON en entrée. De plus, ce mode prend en charge jusqu'à 40 itérations simultanées.

Pour plus d'informations, veuillez consulter Utilisation de l'état de la carte en mode Inline.
Distribué — Mode de simultanéité élevé. Dans ce mode, l'Mapétat exécute chaque itération en tant qu'exécution d'un flux de travail enfant, ce qui permet une simultanéité élevée de jusqu'à 10 000 exécutions parallèles de flux de travail enfant. Chaque exécution de flux de travail enfant possède son propre historique d'exécution distinct de celui du flux de travail parent.

Dans ce mode, l'MapÉtat peut accepter un tableau JSON ou une source de données Amazon S3, telle qu'un fichier CSV, comme entrée.

Pour plus d'informations, veuillez consulter Utilisation de l'état de la carte en mode distribué.

Le mode à utiliser dépend de la manière dont vous souhaitez traiter les éléments d'un ensemble de données. Utilisez l'Mapétat en mode Inline si l'historique d'exécution de votre flux de travail ne doit pas dépasser 25 000 entrées ou si vous n'avez pas besoin de plus de 40 itérations simultanées.

Utilisez l'Mapétat en mode distribué lorsque vous devez orchestrer des charges de travail parallèles à grande échelle répondant à une combinaison des conditions suivantes :

La taille de votre jeu de données dépasse 256 Ko.
L'historique des événements d'exécution du flux de travail dépasse 25 000 entrées.
Vous avez besoin d'une simultanéité de plus de 40 itérations parallèles.

Rubriques

Différences entre le mode en ligne et le mode distribué

Le tableau suivant met en évidence les différences entre les modes en ligne et distribué.

Mode en ligne	Mode distribué
Supported data sources
Accepte un tableau JSON transmis depuis une étape précédente du flux de travail en entrée.	Accepte les sources de données suivantes en entrée : Tableau JSON transmis depuis une étape précédente du flux de travail Fichier JSON dans un compartiment Amazon S3 contenant un tableau Fichier CSV dans un compartiment Amazon S3 Liste d'objets Amazon S3 Inventaire Amazon S3
Map iterations
Dans ce mode, chaque itération de l'`Map`état s'exécute dans le contexte du flux de travail qui contient l'`Map`état. Step Functions ajoute l'historique d'exécution de ces itérations à l'historique d'exécution du flux de travail parent.	Dans ce mode, l'`Map`état exécute chaque itération en tant qu'exécution d'un flux de travail enfant, ce qui permet une simultanéité élevée de jusqu'à 10 000 exécutions parallèles de flux de travail enfant. Chaque exécution de flux de travail enfant possède son propre historique d'exécution distinct de celui du flux de travail parent.
Maximum concurrency for parallel iterations
Permet d'exécuter jusqu'à 40 itérations aussi simultanément que possible.	Vous permet d'exécuter jusqu'à 10 000 exécutions parallèles de flux de travail enfant pour traiter des millions d'éléments de données à la fois.
Input payload and event history sizes
Impose une limite de 256 Ko à la taille de la charge utile d'entrée et à 25 000 entrées dans l'historique des événements d'exécution.	Permet de contourner la limite de taille de la charge utile, car l'`Map`État peut lire les entrées directement depuis les sources de données Amazon S3. Dans ce mode, vous pouvez également contourner les limites de l'historique d'exécution, car les exécutions du flux de travail enfant lancées par l'`Map`État conservent leur propre historique d'exécution distinct de l'historique d'exécution du flux de travail parent.
Monitoring and observability
Vous pouvez consulter l'historique d'exécution du flux de travail depuis la console ou en appelant l'action d'`GetExecutionHistory`API. Vous pouvez également consulter l'historique des exécutions via CloudWatch X-Ray.	Lorsque vous exécutez un `Map` état en mode distribué, Step Functions crée une ressource Map Run. Une exécution de carte fait référence à un ensemble d'exécutions de flux de travail secondaires lancées par un état de carte distribuée. Vous pouvez consulter un Map Run dans la console Step Functions. Vous pouvez également invoquer l'action d'`DescribeMapRun`API. Un Map Run envoie également des métriques à. CloudWatch Pour plus d'informations, veuillez consulter Examen de l'exécution cartographique d'une exécution de l'état d'une carte distribuée.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Map

Utilisation de l'état de la carte en mode Inline