Exploration, analyse et traitement de données
Généralement, avant d'utiliser un ensemble de données pour entraîner un modèle, les spécialistes des données explorent, analysent et prétraitent ces données.
Amazon SageMaker Processing permet d'exécuter des tâches de pré- et post-traitement des données, effectuer une ingénierie des fonctionnalités et évaluer des modèles facilement et à grande échelle sur SageMaker. Combiné aux autres tâches essentielles de machine learning fournies par SageMaker, telles que l'entraînement et l'hébergement, Processing vous procure les avantages d'un environnement de machine learning entièrement géré, notamment la prise en charge de la sécurité et de la conformité intégrée dans SageMaker. Processing vous offre la flexibilité d'utiliser les conteneurs de traitement de données intégrés ou d'apporter vos propres conteneurs, et d'envoyer des tâches personnalisées à exécuter sur une infrastructure gérée. Après qu'une tâche a été envoyée, SageMaker lance les instances de calcul, traite et analyse les données d'entrée, et libère les ressources une fois le processus terminé. Pour plus d'informations, consultez Traiter des données.
-
Pour de plus amples informations sur l'exécution de vos propres scripts de traitement des données, veuillez consulter Traitement de données avec scikit-learn.
-
Pour de plus amples informations sur la création de votre propre conteneur de traitement pour exécuter des scripts, veuillez consulter Génération de votre propre conteneur de traitement (scénario avancé).
-
Pour plus d'informations sur la méthode à privilégier pour effectuer une analyse exploratoire des données (EDA) avec une interface visuelle sans code, consultez Préparer les données ML avec Amazon SageMaker Data Wrangler.