Démarrer avec les instances de bloc-notes Amazon SageMaker - Amazon SageMaker

Démarrer avec les instances de bloc-notes Amazon SageMaker

L'une des meilleures façons pour les praticiens du machine learning (ML) d'utiliser Amazon SageMaker consiste à entraîner et déployer des modèles de ML à l'aide d'instances de bloc-notes SageMaker. Les instances de bloc-notes SageMaker aident à créer l'environnement en initiant des serveurs Jupyter sur Amazon Elastic Compute Cloud (Amazon EC2) et en fournissant des noyaux préconfigurés avec les packages suivants : le kit SDK Amazon SageMaker Python, AWS SDK for Python (Boto3), AWS Command Line Interface (AWS CLI), Conda, Pandas, bibliothèques de cadres de deep learning et autres bibliothèques pour la science des données et le machine learning.

Machine learning avec le kit SDK SageMaker Python

Pour entraîner, valider, déployer et évaluer un modèle de ML dans une instance de bloc-notes SageMaker, utilisez le kit SDK SageMaker Python. Le kit SDK SageMaker Python extrait les opérations d'API AWS SDK for Python (Boto3) et SageMaker. Il vous permet d'intégrer et d'orchestrer d'autres services AWS, tels qu'Amazon Simple Storage Service (Amazon S3) pour l'enregistrement de données et d'artefacts de modèles, Amazon Elastic Container Registry (ECR) pour l'importation et l'entretien des modèles de ML, Amazon Elastic Compute Cloud (Amazon EC2) pour l'entraînement et l'inférence.

Vous pouvez également tirer parti des fonctions de SageMaker qui vous aident à gérer chaque étape d'un cycle de ML complet : étiquetage des données, prétraitement des données, entraînement du modèle, déploiement des modèles, évaluation des performances de prédiction et surveillance de la qualité du modèle en production.

Si c'est la première fois que vous utilisez SageMaker, nous vous recommandons d'utiliser le kit SDK SageMaker Python, en suivant le didacticiel de ML de bout en bout. Pour trouver la documentation open source, veuillez consulter le kit SDK Amazon SageMaker Python.

Présentation du didacticiel

Ce didacticiel de mise en route vous explique comment créer une instance de bloc-notes SageMaker, ouvrir un bloc-notes Jupyter avec un noyau préconfiguré avec l'environnement Conda pour le machine learning et démarrer une session SageMaker pour exécuter un cycle de ML de bout en bout. Vous apprendrez à enregistrer un jeu de données dans un compartiment Amazon S3 par défaut associé automatiquement à la séance SageMaker, à envoyer une tâche d'entraînement d'un modèle de ML à Amazon EC2 et à déployer le modèle entraîné à des fins de prédiction par hébergement ou par inférence par lots via Amazon EC2.

Ce didacticiel montre en détails un flux complet de ML d'entraînement du modèle XGBoost à partir du groupe de modèles intégré SageMaker. Vous utilisez le jeu de données du recensement des adultes aux États-Unis et vous évaluez les performances du modèle SageMaker XGBoost entraîné pour prédire le revenu des personnes.