Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Cree un trabajo de clasificación de imágenes con el AutoML API
Las siguientes instrucciones muestran cómo crear un trabajo de Amazon SageMaker Autopilot como experimento piloto para tipos de problemas de clasificación de imágenes mediante SageMaker APIReference.
nota
Tareas como la clasificación de textos e imágenes, la previsión de series temporales y el ajuste de modelos lingüísticos de gran tamaño están disponibles exclusivamente a través de la versión 2 del AutoML. REST API Si el lenguaje de su elección es Python, puede hacer AWS SDK for Python (Boto3)
Los usuarios que prefieran la comodidad de una interfaz de usuario pueden usar Amazon SageMaker Canvas para acceder a modelos previamente entrenados y modelos básicos de IA generativa, o crear modelos personalizados adaptados a textos específicos, clasificación de imágenes, necesidades de previsión o IA generativa.
Puede crear un experimento de clasificación de imágenes con piloto automático mediante programación llamando a la CreateAutoMLJobV2
APIacción en cualquier idioma compatible con Amazon SageMaker Autopilot o el. AWS CLI
Para obtener información sobre cómo esta API acción se traduce en una función en el idioma que prefiera, consulte la sección Vea también de CreateAutoMLJobV2
y seleccione una. SDK Como ejemplo, para los usuarios de Python, consulte la sintaxis de solicitud completa de create_auto_ml_job_v2
en AWS SDK for Python (Boto3).
La siguiente es una colección de parámetros de solicitud de entrada obligatorios y opcionales para la CreateAutoMLJobV2
API acción utilizada en la clasificación de imágenes.
Parámetros necesarios
Al llamar a CreateAutoMLJobV2
para crear un experimento de Piloto automático para la clasificación de imágenes, debe proporcionar los siguientes valores:
-
Un
AutoMLJobName
para especificar el nombre del trabajo. -
Al menos un
AutoMLJobChannel
enAutoMLJobInputDataConfig
para especificar el origen de datos. -
Un
AutoMLProblemTypeConfig
del tipoImageClassificationJobConfig
. -
Una
OutputDataConfig
para especificar la ruta de salida de Amazon S3 a fin de almacenar los artefactos de su trabajo de AutoML. -
R
RoleArn
para especificar ARN la función que se utiliza para acceder a sus datos.
Todos los demás parámetros son opcionales.
Parámetros opcionales
En las siguientes secciones, se proporcionan detalles sobre algunos parámetros opcionales que puede transferir al trabajo AutoML de clasificación de imágenes.
Puede proporcionar su propio conjunto de datos de validación y una tasa de división de datos personalizada, o puede dejar que Piloto automático divida el conjunto de datos automáticamente.
Cada AutoMLJobChannel
objeto (consulte el parámetro obligatorio A utoMLJob InputDataConfig) tiene unaChannelType
, que se puede configurar en validation
valores que especifican cómo se van a utilizar los datos al crear un modelo de aprendizaje automático. training
Debe proporcionar al menos un origen de datos y un máximo de dos: uno para los datos de entrenamiento y otro para los datos de validación. La forma de dividir los datos en conjuntos de datos de entrenamiento y validación depende de si tiene uno o dos orígenes de datos.
La forma de dividir los datos en conjuntos de datos de entrenamiento y validación depende de si tiene uno o dos orígenes de datos.
-
Si solo tiene un origen de datos, el
ChannelType
se establece entraining
de forma predeterminada y debe tener este valor.-
Si el valor
ValidationFraction
enAutoMLDataSplitConfig
no está establecido, el 20 % (0,2) de los datos de este origen se utiliza para la validación de forma predeterminada. -
Si la
ValidationFraction
se establece en un valor entre 0 y 1, el conjunto de datos se divide en función del valor especificado, donde el valor especifica la fracción del conjunto de datos utilizada para la validación.
-
-
Si tiene dos orígenes de datos, el
ChannelType
de uno de los objetos deAutoMLJobChannel
debe establecerse entraining
, el valor predeterminado. ElChannelType
del otro origen de datos debe estar establecido envalidation
. Las dos fuentes de datos deben tener el mismo formato (Parquet CSV o Parquet) y el mismo esquema. En este caso, no debe establecer el valor deValidationFraction
, ya que todos los datos de cada origen se utilizan para el entrenamiento o la validación. Si se configura este valor, se producirá un error.
Para permitir la implementación automática del mejor candidato modelo para un trabajo de AutoML, incluya un ModelDeployConfig
en la solicitud de trabajo de AutoML. Esto permitirá implementar el mejor modelo en un SageMaker punto final. A continuación, se muestran las configuraciones disponibles para la personalización.
-
Para permitir que Piloto automático genere el nombre del punto de conexión, configure
AutoGenerateEndpointName
enTrue
. -
Si desea proporcionar su propio nombre para el punto de conexión, configure
AutoGenerateEndpointName to
.False
and provide a name of your choice in EndpointName