Utilisation d'instances de bloc-notes pour créer des modèles - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation d'instances de bloc-notes pour créer des modèles

L'un des meilleurs moyens pour les professionnels du machine learning (ML) d'utiliser Amazon SageMaker consiste à former et à déployer des modèles de machine learning à l'aide d'instances de SageMaker bloc-notes. Les instances de SageMaker bloc-notes aident à créer l'environnement en lançant des serveurs Jupyter sur Amazon Elastic Compute Cloud (Amazon EC2) et en fournissant des noyaux préconfigurés avec les packages suivants : le SDK Amazon SageMaker Python,,AWS CLI(), Conda, Pandas AWS SDK for Python (Boto3) AWS Command Line Interface , les bibliothèques de framework d'apprentissage profond et d'autres bibliothèques pour la science des données et le machine learning.

Machine Learning avec le SDK SageMaker Python

Pour entraîner, valider, déployer et évaluer un modèle de machine learning dans une instance de SageMaker notebook, utilisez le SDK SageMaker Python. Les résumés du SDK SageMaker Python AWS SDK for Python (Boto3) et les opérations de SageMaker l'API. Il vous permet d'intégrer et d'orchestrer d'autres AWS services, tels qu'Amazon Simple Storage Service (Amazon S3) pour enregistrer des données et des artefacts de modèles, Amazon Elastic Container Registry (ECR) pour importer et gérer les modèles ML, Amazon Elastic Compute Cloud (Amazon EC2) pour la formation et l'inférence.

Vous pouvez également tirer parti des SageMaker fonctionnalités qui vous aident à gérer chaque étape d'un cycle complet de machine learning : étiquetage des données, prétraitement des données, formation des modèles, déploiement des modèles, évaluation des performances de prédiction et surveillance de la qualité du modèle en production.

Si vous utilisez le logiciel pour la première SageMaker fois, nous vous recommandons d'utiliser le SDK SageMaker Python, en suivant le didacticiel end-to-end ML. Pour accéder à la documentation open source, consultez le SDK Amazon SageMaker Python.

Présentation du tutoriel

Ce didacticiel de mise en route explique comment créer une instance de SageMaker bloc-notes, ouvrir un bloc-notes Jupyter avec un noyau préconfiguré dans l'environnement Conda pour l'apprentissage automatique et démarrer une SageMaker session pour exécuter un cycle ML. end-to-end Vous apprendrez à enregistrer un ensemble de données dans un compartiment Amazon S3 par défaut automatiquement associé à la SageMaker session, à soumettre une tâche de formation portant sur un modèle de ML à Amazon EC2 et à déployer le modèle entraîné à des fins de prédiction par hébergement ou par inférence par lots via Amazon EC2.

Ce didacticiel montre explicitement un flux ML complet d'entraînement du modèle XGBoost à partir du pool de modèles SageMaker intégré. Vous utilisez l'ensemble de données du recensement des adultes des États-Unis et vous évaluez les performances du modèle SageMaker XGBoost entraîné en matière de prévision du revenu des individus.