Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
El formato de manifiesto aumentado le permite realizar el entrenamiento en modo de canalización con archivos sin necesidad de crear archivos RecordIO. Debe especificar los canales de capacitación y de validación como valores para el parámetro InputDataConfig
de la solicitud CreateTrainingJob
. Los archivos de manifiesto aumentados son solo compatibles con los canales con el modo de entrada de datos por canal. Para cada canal, los datos se extraen de su archivo de manifiesto aumentado y transmiten (en orden) al algoritmo a través de la canalización denominada del canal. El modo de canalización usa el método primero en entrar, primero en salir (FIFO) para que los registros se procesen en el orden en que se pusieron en cola. Para obtener información sobre el modo de entrada de canalización, consulte Input Mode
.
Los nombres de atributo con un sufijo "-ref"
apuntan a los datos binarios preformateados. En algunos casos, el algoritmo sabe cómo analizar los datos. En otros casos, podría tener que incluir los datos para que los registros se delimiten para el algoritmo. Si el algoritmo es compatible con los datos con formato RecordIORecordIO
para RecordWrapperType
resuelve este problema. Si el algoritmo no es compatible con el formato RecordIO
, especifique None
para RecordWrapperType
y asegúrese de que sus datos se analicen correctamente para su algoritmo.
Al usar el ejemplo ["image-ref", "is-a-cat"]
, si usa el encapsulamiento RecordIO, la siguiente transmisión de datos se envía a la cola:
recordio_formatted(s3://amzn-s3-demo-bucket/foo/image1.jpg)recordio_formatted("1")recordio_formatted(s3://amzn-s3-demo-bucket/bar/image2.jpg)recordio_formatted("0")
Las imágenes que no se encapsulan con el formato RecordIO se transmiten con el valor de atributo is-a-cat
correspondiente como un registro. Esto puede dar lugar a un problema, ya que el algoritmo podría no delimitar las imágenes y los atributos correctamente. Para obtener más información sobre el uso de archivos de manifiesto aumentados para la clasificación de imágenes, consulte Train with Augmented Manifest Image Format.
Con los archivos de manifiesto aumentados y el modo Pipe en general, no se aplican los límites de tamaño del volumen de EBS. Esto incluye configuraciones que, de lo contrario, deben estar dentro del límite de tamaño del volumen de EBS, como S3DataDistributionType
. Para obtener más información sobre el modo de canalización y cómo usarlo, consulte la sección Using Your Own Training Algorithms - Input Data Configuration.