Crear tu SageMaker recurso de Amazon - AWS Marketplace

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Crear tu SageMaker recurso de Amazon

Para publicar un paquete de modelos o un producto de algoritmo, debe crear el recurso de paquete de modelo o recurso de algoritmo correspondiente en Amazon SageMaker.

Al crear el recurso para un AWS Marketplace producto, debe certificarse mediante un paso de validación. El paso de validación requiere que proporcione datos para probar el paquete de modelos o el recurso de algoritmo antes de que se pueda publicar.

nota

Si aún no ha creado las imágenes de su producto y las ha subido a Amazon Elastic Container Registry (Amazon ECR), consulte Empaquetar su código en imágenes y Cargar sus imágenes para obtener información sobre cómo hacerlo.

Creación de su paquete de modelos

Los siguientes son requisitos para crear un paquete de modelos para AWS Marketplace:

  • Una imagen de inferencia almacenada en Amazon ECR

  • (Opcional) Artefactos del modelo, almacenados por separado en Amazon S3

  • Los datos de prueba utilizados para realizar inferencias y almacenados en Amazon Simple Storage Service (Amazon S3)

nota

A continuación, se aborda la creación de un producto de paquete de modelos. Para obtener más información sobre los paquetes de modelos en SageMaker, consulte Create a Model Package Resource.

Creación de los recursos del paquete de modelos

Los siguientes procedimientos le guiarán en la creación de los recursos del paquete de modelos.

Paso 1: Crear los recursos del paquete de modelos
  1. Abre la SageMaker consola de Amazon.

  2. Comprueba que te encuentras en la AWS región desde la que quieres publicar consultando la parte superior derecha de la página. Para publicar, consulte la sección Compatible con Regiones de AWS la publicación. La imagen de inferencia que cargó en Amazon ECR en los pasos anteriores debe estar en la misma región.

  3. En el menú de navegación izquierdo, elija Paquetes de modelos.

  4. Seleccione Create model package (Crear paquete de modelos).

Tras crear el paquete, debe establecer las especificaciones del paquete de inferencia.

Paso 2: Establecer las especificaciones de inferencia
  1. Proporcione un nombre para el paquete modelo (por ejemplo, my-model-package).

  2. En Ubicación de la imagen de inferencia, introduzca el URI de la imagen de inferencia que se cargó en Amazon ECR. Para recuperar el URI, busque la imagen en la consola de Amazon ECR.

  3. Si los artefactos del modelo del entrenamiento se incluyen con la lógica en la imagen de inferencia, deje en blanco el campo Ubicación de los artefactos de datos del modelo. De lo contrario, especifique la ubicación completa en Amazon S3 del archivo comprimido (.tar.gz) de los artefactos del modelo.

  4. En el cuadro desplegable, elija los tipos de instancia compatibles de la imagen de inferencia para los trabajos de inferencia en tiempo real (también denominados puntos de conexión) y de transformación por lotes.

  5. Elija Siguiente.

Antes de poder crear y publicar el paquete de modelos, es necesario validarlo para garantizar que funcione según lo esperado. Esto requiere que ejecute un trabajo de transformación por lotes con los datos de prueba que proporcione para la inferencia. Las especificaciones de validación indican SageMaker cómo realizar la validación.

Paso 3: Establecer las especificaciones de validación
  1. Establezca Publicar este paquete de modelos en AWS Marketplace . Si lo establece en No, no podrá publicar este paquete de modelos más adelante. Si selecciona Sí, se certifica el paquete modelo AWS Marketplace y se requiere el paso de validación.

  2. Si es la primera vez que completa este proceso, elija Crear un nuevo rol para el rol de IAM. Amazon SageMaker utiliza esta función cuando despliega tu paquete modelo. Esto incluye acciones, como extraer imágenes de Amazon ECR y artefactos de Amazon S3. Revise la configuración y elija Crear rol. Al crear un rol aquí, se otorgan los permisos descritos en la política de AmazonSageMakerFullAccessIAM al rol que se cree.

  3. Edita el JSON en el perfil de validación. Para obtener más información sobre los valores permitidos, consulte TransformJobDefinition.

    1. TransformInput.DataSource.S3Uri: establece el lugar donde se almacenan los datos de las pruebas para la inferencia.

    2. TransformInput.ContentType: especifique el tipo de contenido de los datos de la prueba (por ejemplo application/jsontext/plain,image/png ,, o cualquier otro valor). SageMaker no valida los datos de entrada reales. Este valor se transfiere al punto de conexión HTTP del contenedor en el valor de encabezado Content-type.

    3. TransformInput.CompressionType: se establece en None si los datos de prueba para la inferencia en Amazon S3 no están comprimidos.

    4. TransformInput.SplitType: se establece en None para pasar cada objeto en Amazon S3 como un todo a efectos de inferencia.

    5. TransformOutput.S3OutputPath: se establece en la ubicación en la que se almacena el resultado de la inferencia.

    6. TransformOutput.AssembleWith: se establece en None para generar cada inferencia como objetos independientes en Amazon S3.

  4. Seleccione Create model package (Crear paquete de modelos).

SageMaker extrae la imagen de inferencia de Amazon ECR, copia cualquier artefacto en el contenedor de inferencias y ejecuta un trabajo de transformación por lotes utilizando los datos de prueba para la inferencia. Una vez finalizada la validación, el estado cambia a Completado.

nota

El paso de validación no evalúa la precisión del modelo con los datos de la prueba. El paso de validación comprueba si el contenedor funciona y responde según lo esperado.

Ha terminado de crear los recursos de su producto de modelo. Siga en Publicación del producto en AWS Marketplace.

Creación de un algoritmo

Los siguientes son requisitos para crear un algoritmo para AWS Marketplace:

  • Una imagen de inferencia almacenada en Amazon ECR

  • Una imagen de entrenamiento almacenada en Amazon ECR

  • Sus datos de prueba para el entrenamiento, almacenados en Amazon S3

  • Sus datos de prueba para la inferencia, almacenados en Amazon S3

nota

En el siguiente tutorial se crea un producto de algoritmo. Para obtener más información, consulte Crear un recurso de algoritmo.

Creación de recursos de algoritmo

Los siguientes procedimientos le guiarán por la creación de los recursos en su paquete de algoritmos.

Paso 1: Crear los recursos del algoritmo
  1. Abre la SageMaker consola de Amazon.

  2. Comprueba que te encuentras en la AWS región desde la que quieres publicar consultando la parte superior derecha de la página (consulteCompatible con Regiones de AWS la publicación). La imagen de entrenamiento e inferencia que cargó en Amazon ECR en los pasos anteriores debe estar en esta misma región.

  3. En el panel de navegación izquierdo, elija Algoritmos.

  4. Elija Create algorithm (Crear algoritmo).

Una vez creado el paquete de algoritmos, debe establecer las especificaciones para el entrenamiento y el ajuste del modelo.

Paso 2: Configurar las especificaciones de entrenamiento y ajuste
  1. Introduzca el nombre del algoritmo (por ejemplo, mi-algoritmo).

  2. En Imagen de entrenamiento, pegue la ubicación URI completa de la imagen de entrenamiento que se cargó en Amazon ECR. Para recuperar el URI, busque la imagen en la consola de Amazon ECR.

  3. En el cuadro desplegable, elija los tipos de instancias de formación compatibles con la imagen de formación.

  4. En la sección Especificaciones del canal, agregue un canal para cada conjunto de datos de entrada que admita su algoritmo, hasta 20 canales de fuentes de entrada. Para obtener más información, consulte Configuración de datos de entrada.

  5. Elija Siguiente.

  6. Si el algoritmo admite hiperparámetros y el ajuste de hiperparámetros, debe especificar los parámetros de ajuste.

  7. Elija Siguiente.

nota

Se recomienda encarecidamente que el algoritmo admita el ajuste de hiperparámetros y que permita ajustar los parámetros adecuados. Esto permite a los científicos de datos ajustar los modelos para obtener los mejores resultados.

Una vez establecidos los parámetros de ajuste, si los hay, debe establecer las especificaciones de la imagen de inferencia.

Paso 3: Establecer la especificación de la imagen de inferencia
  1. En Ubicación de la imagen de inferencia, pegue el URI de la imagen de inferencia cargada en Amazon ECR. Para recuperar el URI, busque la imagen en la consola de Amazon ECR.

  2. En el cuadro desplegable, elija los tipos de instancia compatibles para su imagen de inferencia, tanto para los trabajos de inferencia en tiempo real (también conocido como punto de conexión) como para los de transformación por lotes.

  3. Elija Siguiente.

Antes de poder crear y publicar el algoritmo, es necesario validarlo para garantizar que funcione según lo esperado. Esto requiere que ejecute un trabajo de entrenamiento con los datos de prueba para el entrenamiento y un trabajo de transformación por lotes con los datos de prueba que proporcione para la inferencia. Las especificaciones de validación indican SageMaker cómo realizar la validación.

Paso 4: Establecer las especificaciones de validación
  1. Establezca Publicar este algoritmo en AWS Marketplace en . Si lo establece en No, no podrá publicar este algoritmo más adelante. Si selecciona Sí, se certifica el algoritmo AWS Marketplace y se requiere la especificación de validación.

  2. Si es la primera vez que crea un paquete de aprendizaje automático para AWS Marketplace, elija Crear un nuevo rol para el rol de IAM. Amazon SageMaker utiliza esta función cuando entrena el algoritmo y despliega el paquete de modelos subsiguiente. Esto incluye acciones como extraer imágenes de Amazon ECR, almacenar artefactos en Amazon S3 y copiar datos de entrenamiento de Amazon S3. Revise la configuración y elija Crear rol. Al crear un rol aquí, se otorgan los permisos descritos en la política de AmazonSageMakerFullAccessIAM al rol que se cree.

  3. Edite el archivo JSON en el perfil de validación para Definición de trabajo de entrenamiento. Para obtener más información sobre los valores permitidos, consulte TrainingJobDefinition.

    1. InputDataConfig: en esta matriz JSON, añada un objeto de canal para cada canal especificado en el paso de especificación del entrenamiento. Para cada canal, especifique dónde se almacenan los datos de las pruebas para el entrenamiento.

    2. OutputDataConfig: una vez finalizado el entrenamiento, los artefactos del modelo de la ruta del directorio del contenedor de formación /opt/ml/model/ se comprimen y se copian en Amazon S3. Especifique la ubicación de Amazon S3 en la que se almacena el archivo comprimido (.tar.gz).

  4. Edite el archivo JSON en el perfil de validación para Definición de trabajo de transformación. Para obtener más información sobre los valores permitidos, consulte TransformJobDefinition.

    1. TransformInput.DataSource.S3Uri: establece el lugar donde se almacenan los datos de las pruebas para la inferencia.

    2. TransformInput.ContentType: especifique el tipo de contenido de los datos de la prueba. Por ejemplo,application/json, text/plain, image/png o cualquier otro valor. Amazon SageMaker no valida los datos de entrada reales. Este valor se transfiere al punto de conexión HTTP del contenedor en el valor de encabezado Content-type.

    3. TransformInput.CompressionType: se establece en None si los datos de prueba para la inferencia en Amazon S3 no están comprimidos.

    4. TransformInput.SplitType: elija cómo quiere dividir los objetos de S3. Por ejemplo, None pasa cada objeto en Amazon S3 como un todo a efectos de inferencia. Para obtener más información, consulta SplitTypela referencia de la SageMaker API de Amazon.

    5. TransformOutput.S3OutputPath: se establece en la ubicación donde se almacena el resultado de la inferencia.

    6. TransformOutput.AssembleWith: se establece en None para generar cada inferencia como objetos independientes en Amazon S3.

  5. Elija Crear paquete de algoritmos.

SageMaker extrae la imagen de entrenamiento de Amazon ECR, ejecuta un trabajo de entrenamiento de prueba con sus datos y almacena los artefactos del modelo en Amazon S3. Luego extrae la imagen de inferencia de Amazon ECR, copia cualquier artefacto de Amazon S3 en el contenedor de inferencias y ejecuta un trabajo de transformación por lotes utilizando los datos de prueba para la inferencia. Una vez finalizada la validación, el estado cambia a Completado.

nota

El paso de validación no evalúa la precisión del entrenamiento o el modelo con los datos de la prueba. El paso de validación comprueba si los contenedores funcionan y responden según lo esperado.

El paso de validación solo valida el procesamiento por lotes. Depende de usted validar que el procesamiento en tiempo real funcione con su producto.

Ha terminado de crear los recursos de su producto de algoritmo. Siga en Publicación del producto en AWS Marketplace.