Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Formato de archivo de manifiesto aumentado para el entrenamiento de modo de canalización

Modo de enfoque
Formato de archivo de manifiesto aumentado para el entrenamiento de modo de canalización - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

El formato de manifiesto aumentado le permite realizar el entrenamiento en modo de canalización con archivos sin necesidad de crear archivos RecordIO. Debe especificar los canales de capacitación y de validación como valores para el parámetro InputDataConfig de la solicitud CreateTrainingJob. Los archivos de manifiesto aumentados son solo compatibles con los canales con el modo de entrada de datos por canal. Para cada canal, los datos se extraen de su archivo de manifiesto aumentado y transmiten (en orden) al algoritmo a través de la canalización denominada del canal. El modo de canalización usa el método primero en entrar, primero en salir (FIFO) para que los registros se procesen en el orden en que se pusieron en cola. Para obtener información sobre el modo de entrada de canalización, consulte Input Mode.

Los nombres de atributo con un sufijo "-ref" apuntan a los datos binarios preformateados. En algunos casos, el algoritmo sabe cómo analizar los datos. En otros casos, podría tener que incluir los datos para que los registros se delimiten para el algoritmo. Si el algoritmo es compatible con los datos con formato RecordIO, la especificación de RecordIO para RecordWrapperType resuelve este problema. Si el algoritmo no es compatible con el formato RecordIO, especifique None para RecordWrapperType y asegúrese de que sus datos se analicen correctamente para su algoritmo.

Al usar el ejemplo ["image-ref", "is-a-cat"], si usa el encapsulamiento RecordIO, la siguiente transmisión de datos se envía a la cola:

recordio_formatted(s3://amzn-s3-demo-bucket/foo/image1.jpg)recordio_formatted("1")recordio_formatted(s3://amzn-s3-demo-bucket/bar/image2.jpg)recordio_formatted("0")

Las imágenes que no se encapsulan con el formato RecordIO se transmiten con el valor de atributo is-a-cat correspondiente como un registro. Esto puede dar lugar a un problema, ya que el algoritmo podría no delimitar las imágenes y los atributos correctamente. Para obtener más información sobre el uso de archivos de manifiesto aumentados para la clasificación de imágenes, consulte Train with Augmented Manifest Image Format.

Con los archivos de manifiesto aumentados y el modo Pipe en general, no se aplican los límites de tamaño del volumen de EBS. Esto incluye configuraciones que, de lo contrario, deben estar dentro del límite de tamaño del volumen de EBS, como S3DataDistributionType . Para obtener más información sobre el modo de canalización y cómo usarlo, consulte la sección Using Your Own Training Algorithms - Input Data Configuration.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.