Amazon SageMaker Model Building Pipelines - Amazon SageMaker

Amazon SageMaker Model Building Pipelines

Amazon SageMaker Model Building Pipelines est un outil permettant de créer des pipelines de machine learning qui tirent parti de l'intégration directe de SageMaker. Grâce à cette intégration, vous pouvez créer un pipeline et configurer des projets SageMaker pour l'orchestration à l'aide d'un outil qui gère une grande partie de la création et de la gestion des étapes pour vous. SageMaker Pipelines offre les avantages suivants par rapport aux autres offres de flux AWS :

Intégration SageMaker

SageMaker Pipelines est directement intégré à SageMaker, vous n'avez donc pas besoin d'interagir avec d'autres services AWS. Vous n'avez pas non plus besoin de gérer des ressources, car SageMaker Pipelines est un service entièrement géré, ce qui signifie qu'il crée et gère des ressources pour vous.

Intégration du kit SDK Python SageMaker

SageMaker Pipelines étant intégré au kit SDK Python SageMaker, vous pouvez créer vos pipelines par programmation à l'aide d'une interface Python de haut niveau que vous connaissez peut-être déjà. Pour consulter la documentation du kit SDK Python SageMaker, veuillez consulter Pipelines.

Intégration de SageMaker Studio

SageMaker Studio offre un environnement pour gérer l'expérience SageMaker Pipelines de bout en bout. À l'aide de Studio, vous pouvez contourner la console AWS pour la gestion complète de votre flux. Pour plus d'informations sur la gestion de SageMaker Pipelines à partir de SageMaker Studio, veuillez consulter Afficher, suivre et exécuter SageMaker Pipelines dans SageMaker Studio.

Suivi du lignage des données

Avec SageMaker Pipelines, vous pouvez suivre l'historique de vos données dans l'exécution du pipeline. Amazon SageMaker ML Lineage Tracking vous permet d'analyser d'où proviennent les données, où elles ont été utilisées comme entrée et les sorties générées à partir de celles-ci. Par exemple, vous pouvez afficher les modèles créés à partir d'un jeu de données individuel et afficher les jeux de données qui ont servi à la création d'un modèle individuel. Pour de plus amples informations, veuillez consulter . Amazon SageMaker ML Lineage Tracking.

Réutilisation de étapes

Avec SageMaker Pipelines, vous pouvez désigner des étapes de mise en cache. Lorsqu'une étape est mise en cache, elle est indexée pour être réutilisée ultérieurement si la même étape est exécutée à nouveau. Par conséquent, vous pouvez réutiliser la sortie des exécutions de l'étape précédente de la même étape dans le même pipeline sans avoir à réexécuter l'étape. Pour plus d'informations sur la mise en cache d'étape, veuillez consulter Mise en cache des étapes du pipeline.