Requisitos del conjunto de datos para la predicción por lotes - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Requisitos del conjunto de datos para la predicción por lotes

Para las predicciones por lotes, asegúrese de que sus conjuntos de datos cumplan los requisitos descritos en Creación de un conjunto de datos. Si el conjunto de datos tiene más de 5 GB, Canvas utiliza Amazon EMR sin servidor para procesar los datos y dividirlos en lotes más pequeños. Después de dividir sus datos, Canvas usa SageMaker AI Batch Transform para hacer predicciones. Es posible que vea los cargos de ambos servicios después de ejecutar predicciones por lotes. Para obtener más información, consulte Precios de Canvas.

Es posible que no pueda realizar predicciones en algunos conjuntos de datos si tienen esquemas incompatibles. Un esquema es una estructura organizativa. En el caso de un conjunto de datos tabular, el esquema son los nombres de las columnas y el tipo de datos de las columnas. Puede producirse un esquema incompatible por las razones siguientes:

  • El conjunto de datos que utiliza para hacer predicciones tiene menos columnas que el conjunto de datos que utiliza para crear el modelo.

  • Los tipos de datos de las columnas que utilizó para crear el conjunto de datos pueden ser diferentes de los tipos de datos del conjunto de datos que utiliza para hacer predicciones.

  • El conjunto de datos que utiliza para hacer predicciones y el conjunto de datos que ha utilizado para crear el modelo tienen nombres de columna que no coinciden. En los nombres de columna se distingue entre mayúsculas y minúsculas. Column1 no es lo mismo que column1.

Para asegurarse de que puede generar correctamente las predicciones por lotes, haga coincidir el esquema de su conjunto de datos de predicciones por lotes con el conjunto de datos que utilizó para entrenar el modelo.

nota

En el caso de las predicciones por lotes, si eliminó alguna columna al crear el modelo, Canvas volverá a agregar las columnas eliminadas a los resultados de la predicción. Sin embargo, Canvas no agrega las columnas eliminadas a sus predicciones por lotes para los modelos de series temporales.