Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de un modelo entrenado en AWS Clean Rooms ML
Requisitos previos:
-
Y Cuenta de AWS con acceso a AWS Clean Rooms
-
Una colaboración creada en AWS Clean Rooms
-
Un algoritmo modelo configurado asociado a la colaboración
-
Al menos un canal de entrada ML configurado
-
Permisos adecuados para crear y administrar modelos de aprendizaje automático en la colaboración
Una vez que haya asociado el algoritmo del modelo configurado a una colaboración y, a continuación, haya creado y configurado un canal de entrada de aprendizaje automático, estará listo para crear un modelo entrenado. Los miembros de una colaboración utilizan un modelo entrenado para analizar sus datos de forma conjunta.
Puede crear un modelo entrenado mediante el siguiente procedimiento.
Como alternativa, puede utilizar el entrenamiento incremental para mejorar un modelo existente con nuevos datos o el entrenamiento distribuido para entrenar modelos en varias instancias de procesamiento.
- Console
-
Para crear un modelo entrenado (consola)
-
Inicie sesión AWS Management Console y abra la AWS Clean Rooms consola en https://console.aws.amazon.com/cleanrooms.
-
En el panel de navegación izquierdo, elija Colaboraciones.
-
En la página de colaboraciones, elija la colaboración en la que desee crear un modelo entrenado.
-
Cuando se abra la colaboración, selecciona la pestaña de modelos de aprendizaje automático.
-
En Modelos de aprendizaje automático personalizados, en la sección Modelos entrenados, elija Crear modelo entrenado.
-
En la página Crear un modelo entrenado, en Algoritmo de modelo asociado, especifique el algoritmo.
-
En los detalles del modelo entrenado, introduzca lo siguiente:
-
En Nombre, introduzca un nombre exclusivo para el modelo de la colaboración.
-
(Opcional) En Descripción, introduzca una descripción del modelo entrenado.
-
En el modo de entrada de datos de entrenamiento, elija una de las siguientes opciones:
-
Seleccione Archivo si tiene un conjunto de datos más pequeño que pueda caber en el volumen de almacenamiento de aprendizaje automático y si prefiere el acceso al sistema de archivos tradicional para su guion de entrenamiento.
-
Selecciona Pipe para obtener conjuntos de datos de gran tamaño para transmitir datos directamente desde S3 y así evitar tener que descargar todo al disco, lo que puede mejorar la velocidad de entrenamiento y reducir los requisitos de almacenamiento.
-
Seleccione FastFileesta opción si desea combinar las ventajas del streaming desde S3 con el acceso al sistema de archivos, especialmente para leer datos de forma secuencial o si utiliza menos archivos para acelerar los tiempos de inicio.
-
Para obtener los detalles del canal de entrada ML, haga lo siguiente:
-
Para el canal de entrada ML, especifique el canal de entrada ML que proporciona datos al algoritmo del modelo.
Para añadir otro canal, elija Añadir otro canal de entrada ML. Puede añadir hasta 19 canales de entrada ML adicionales.
-
En Nombre del canal, introduzca el nombre del canal de entrada ML.
-
Para el tipo de distribución de datos de Amazon S3, elija una de las siguientes opciones:
-
Seleccione Completamente replicado para proporcionar a cada instancia de entrenamiento una copia completa de su conjunto de datos. Esto funciona mejor cuando el conjunto de datos es lo suficientemente pequeño como para caber en la memoria o cuando cada instancia necesita acceder a todos los datos.
-
Selecciona Fragmentado por la clave S3 para dividir el conjunto de datos entre las instancias de entrenamiento en función de las claves S3. Cada instancia recibe aproximadamente 1/n del total de objetos de S3, donde «n» es el número de instancias. Esto funciona mejor para conjuntos de datos grandes que desee procesar en paralelo.
Tenga en cuenta el tamaño del conjunto de datos y los requisitos de formación al seleccionar un tipo de distribución. La replicación completa proporciona un acceso completo a los datos, pero requiere más almacenamiento, mientras que la clave Sharded by S3 permite el procesamiento distribuido de grandes conjuntos de datos.
-
En Duración máxima del entrenamiento, elige la cantidad máxima de tiempo que deseas entrenar tu modelo.
-
En el caso de los hiperparámetros, especifique los parámetros específicos del algoritmo y sus valores previstos. Los hiperparámetros son específicos del modelo que se está entrenando y se utilizan para ajustar el entrenamiento del modelo.
-
En el caso de las variables de entorno, especifique cualquier variable específica del algoritmo y sus valores previstos. Las variables de entorno se configuran en el contenedor de Docker.
-
En el caso del cifrado, para usar una personalizada AWS KMS key, selecciona la casilla de verificación Cifrar el secreto con una clave KMS personalizada.
-
En la configuración de EC2 recursos, especifique la información sobre los recursos informáticos que se utilizan para el entrenamiento de modelos.
-
En Tipo de instancia, elija el tipo de instancia que desee ejecutar.
-
En Recuento de instancias, introduzca el número de instancias.
-
Para el tamaño del volumen en GB, introduzca el tamaño del volumen de almacenamiento de ML.
-
Elija Crear modelo entrenado.
- API
-
Para crear un modelo entrenado (API)
El miembro con la capacidad de entrenar un modelo comienza a entrenar seleccionando el canal de entrada de ML y el algoritmo del modelo.
Ejecute el siguiente código con sus parámetros específicos:
import boto3
acr_ml_client= boto3.client('cleanroomsml')
acr_ml_client.create_trained_model(
membershipIdentifier= 'membership_id
',
configuredModelAlgorithmAssociationArn = 'arn:aws:cleanrooms-ml:region
:account
:membership
/membershipIdentifier/configured-model-algorithm-association/identifier
',
name='trained_model_name
',
resourceConfig={
'instanceType': "ml.m5.xlarge",
'volumeSizeInGB': 1
},
dataChannels=[
{
"mlInputChannelArn": channel_arn_1,
"channelName": "channel_name
"
},
{
"mlInputChannelArn": channel_arn_2,
"channelName": "channel_name
"
}
]
)
Una vez creado el modelo entrenado, no podrá editarlo. Para realizar cambios, elimine el modelo entrenado y cree uno nuevo.