Migre cargas de trabajo de aprendizaje automático: cree, entrene e implemente a Amazon SageMaker con herramientas para AWS desarrolladores - Recomendaciones de AWS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Migre cargas de trabajo de aprendizaje automático: cree, entrene e implemente a Amazon SageMaker con herramientas para AWS desarrolladores

Creado por Scot Marvin () AWS

Tipo R: redefinir la plataforma

Origen: Machine Learning

Objetivo: Amazon SageMaker

Creado por: AWS

Entorno: PoC o piloto

Tecnologías: aprendizaje automático e inteligencia artificial DevOps; migración

AWSservicios: Amazon SageMaker

Resumen

Este patrón proporciona orientación para migrar una aplicación de aprendizaje automático (ML) local que se ejecuta en servidores Unix o Linux para capacitarla e implementarla con AWS Amazon. SageMaker Esta implementación utiliza una canalización de integración continuas (CI/CD). El patrón de migración se implementa mediante una pila. AWS CloudFormation

Requisitos previos y limitaciones

Requisitos previos 

  • Una AWS cuenta activa que usa AWSLanding Zone

  • AWSInterfaz de línea de comandos (AWSCLI) instalada y configurada en su servidor Unix o Linux

  • Un repositorio de código fuente de ML en Amazon Simple Storage Service (Amazon S3) o en Amazon Simple Storage Service (Amazon S3) GitHub AWS CodeCommit

Limitaciones

  • Solo se pueden implementar 300 canalizaciones individuales en una AWS región.

  • Este patrón está pensado para cargas de trabajo de aprendizaje automático supervisadas con train-and-deploy código en Python.

Versiones de producto

  • Docker versión 19.03.5, compilación 633a0ea, con Python 3.6x

Arquitectura

Pila de tecnología de origen

  • Instancia informática de Linux en las instalaciones con datos en el sistema de archivos local o en una base de datos relacional

Arquitectura de origen

Diagram showing on-premises setup with Python, Jupyter, and database components interconnected.

Pila de tecnología de destino

  • AWS CodePipeline desplegado con Amazon S3 para el almacenamiento de datos y Amazon DynamoDB como almacén de metadatos para rastrear o registrar las ejecuciones de canalizaciones

Arquitectura de destino

AWS machine learning workflow diagram showing integration of various services for model development and deployment.

Arquitectura de migración de aplicaciones

  • Paquete y AWS CodeCommit repositorio de Python nativos (y un SQL cliente, para conjuntos de datos locales en una instancia de base de datos)

Nube de AWS architecture diagram showing ML pipeline orchestration and data flow from on-premises to cloud services.

Herramientas

  • Python

  • Git 

  • AWSCLI— AWSCLIDespliega la AWS CloudFormation pila y mueve los datos al depósito de S3. El bucket de S3, a su vez, conduce al objetivo.

Epics

TareaDescripciónHabilidades requeridas
Valide el código fuente y los conjuntos de datos.Científico de datos
Identifique los tipos y tamaños de las instancias de creación, entrenamiento e implementación de destino.Ingeniero de datos, científico de datos
Cree una lista de capacidades y requisitos de capacidad.
Identifique requisitos de red.DBA, administrador de sistemas
Identifique requisitos de seguridad para acceder a la red o al host para las aplicaciones de origen y destino.Ingeniero de ML, ingeniero de datos, administrador de sistemas
Determine la estrategia de copia de seguridad.Ingeniero de ML, administrador de sistemas
Determine los requisitos de disponibilidad.Ingeniero de ML, administrador de sistemas
Identifique la estrategia de migración o transición de aplicaciones.Científico de datos, ingeniero de machine learning
TareaDescripciónHabilidades requeridas
Cree una nube privada virtual (VPC).Ingeniero de ML, administrador de sistemas
Cree grupos de seguridad.Ingeniero de ML, administrador de sistemas
Configure un bucket de Amazon S3 y ramas de AWS CodeCommit repositorio para el código ML.Ingeniero de ML
TareaDescripciónHabilidades requeridas
Utilice My SQL tools nativas o herramientas de terceros para migrar, entrenar, validar y probar conjuntos de datos al bucket de S3 aprovisionado.

Esto es necesario para la implementación de la AWS CloudFormation pila.

Ingeniero de datos, ingeniero de machine learning
Package el tren ML y el código de alojamiento como paquetes de Python y envíelos al repositorio aprovisionado en AWS CodeCommit o GitHub.

Necesitas el nombre de la rama del repositorio para implementar la AWS CloudFormation plantilla para la migración.

Científico de datos, ingeniero de machine learning
TareaDescripciónHabilidades requeridas
Siga la estrategia de migración de la carga de trabajo de ML.Propietario de la aplicación, ingeniero de machine learning
Implemente la AWS CloudFormation pila.

Utilice AWS CLI para crear la pila declarada en la YAML plantilla proporcionada con esta solución.

Científico de datos, ingeniero de machine learning
TareaDescripciónHabilidades requeridas
Cambie los clientes de la aplicación a la nueva infraestructura.Propietario de la aplicación, científico de datos, ingeniero de machine learning
TareaDescripciónHabilidades requeridas
Cierre los AWS recursos temporales.

Cierre todos los recursos personalizados de la AWS CloudFormation plantilla (por ejemplo, las funciones de AWS Lambda que no se estén utilizando).

Científico de datos, ingeniero de machine learning
Revise y valide los documentos del proyecto.Propietario de la aplicación, científico de datos
Valide los resultados y las métricas de evaluación del modelo de ML con los operadores.

Asegúrese de que el rendimiento del modelo cumpla con las expectativas de los usuarios de la aplicación y sea comparable al estado en las instalaciones.

Propietario de la aplicación, científico de datos
Cerrar el proyecto y enviar comentarios.Propietario de la aplicación, ingeniero de machine learning

Recursos relacionados

Conexiones

Para acceder al contenido adicional asociado a este documento, descomprima el archivo: attachment.zip