Amazon SageMaker
Developer Guide

Introducción

La mejor forma de aprender a utilizar Amazon SageMaker es crear, capacitar e implementar un modelo de aprendizaje automático sencillo. Para ello, necesita lo siguiente:

  • Un conjunto de datos Puede utilizar el conjunto de datos de MNIST (Modified National Institute of Standards and Technology) de imágenes de números de un solo dígito escritos a mano. Este conjunto de datos proporciona un conjunto de capacitación de 50 000 imágenes de ejemplo de números de un solo dígito escritos a mano, un conjunto de validación de 10 000 imágenes y un conjunto de datos de prueba de 10 000 imágenes. Proporcione este conjunto de datos al algoritmo para la capacitación de modelos. Para obtener más información acerca del conjunto de datos, consulte conjunto de datos de MNIST.

  • Un algoritmo. Puede utilizar el algoritmo XGBoost proporcionado por Amazon SageMaker para capacitar modelos utilizando el conjunto de datos de MNIST. Durante la capacitación de modelos, el algoritmo asigna los datos de ejemplo de los números escritos a mano en 10 clústeres (uno para número, de 0 a 9). Para obtener más información sobre el algoritmo, consulte Algoritmo XGBoost.

También necesita algunos recursos para almacenar los datos y ejecutar el código en este ejercicio:

  • Un bucket de Amazon Simple Storage Service (Amazon S3) para almacenar los datos de capacitación y los artefactos de modelo que crea Amazon SageMaker cuando se capacita el modelo.

  • Una instancia de bloc de notas de Amazon SageMaker para preparar y procesar datos y para capacitar e implementar un modelo de aprendizaje automático.

  • Un bloc de notas de Jupyter para su uso con la instancia de bloc de notas para preparar los datos de capacitación y capacitar e implementar el modelo.

En este ejercicio, aprenderá a crear todos los recursos que necesita para crear, capacitar e implementar un modelo.

importante

Para la validación, implementación y capacitación de modelos, puede usar cualquiera de las siguientes opciones:

  • El SDK de Phyton de Amazon SageMaker de alto nivel

  • El AWS SDK para Python (Boto 3)

El SDK de Phyton deAmazon SageMaker resume varios detalles de implementación y es fácil de usar. Este ejercicio proporciona ejemplos de código para ambas bibliotecas. Si es un usuario nuevo de Amazon SageMaker, le recomendamos que utilice el SDK de Phyton de Amazon SageMaker. Para obtener más información, consulte la sección https://sagemaker.readthedocs.io/en/stable/overview.html.

Si es la primera vez que utiliza Amazon SageMaker, le recomendamos que lea Funcionamiento de Amazon SageMaker antes de comenzar este ejercicio.