Preparación e importación de datos masivos - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Preparación e importación de datos masivos

Una vez creado un conjunto de datos, podrá empezar a importar sus datos históricos masivos a Amazon Personalize. Tiene dos opciones para importar sus registros masivos:

  • Para los conjuntos de datos de interacciones de elementos, usuarios y elementos, puede usar Amazon SageMaker Data Wrangler para importar sus datos de más de 40 orígenes, generar visualizaciones e información específica de Amazon Personalize y transformarlos para cumplir con los requisitos de Amazon Personalize.

  • Puede importar datos masivos directamente en todos los tipos de conjuntos de datos. Al importar directamente, formatea manualmente los datos para cumplir con los requisitos de Amazon Personalize y los carga en Amazon S3. A continuación, crea un esquema y un conjunto de datos, e importa los datos directamente en el conjunto de datos con un trabajo de importación de conjunto de datos.

Las siguientes pautas pueden ayudarlo a asegurarse de que sus datos masivos tengan el formato correcto.

  • Sus datos de entrada deben estar en un archivo CSV (valores separados por comas).

  • La primera fila del archivo CSV debe contener sus encabezados de columnas. No incluya los encabezados entre comillas (").

  • Asegúrese de tener los campos obligatorios para el tipo de conjunto de datos y asegúrese de que sus nombres cumplan con los requisitos de Amazon Personalize. Por ejemplo, sus datos de elementos podrían tener una columna llamada ITEM_IDENTIFICATION_NUMBER con los ID de cada uno de sus elementos. Para usar esta columna como un campo ITEM_ID, cambie el nombre de la columna a ITEM_ID. Si usa Data Wrangler para aplicar formato a sus datos, puede usar la transformación de Data Wrangler Asignar columnas para Amazon Personalize para asegurarse de que sus columnas tengan el nombre correcto.

    Para obtener información acerca de los campos necesarios, consulte Schemas. Para obtener información acerca del uso de Data Wrangler para preparar sus datos, consulte Preparación e importación de datos mediante Amazon SageMaker Data Wrangler.

  • Los nombres de los encabezados de las columnas de su archivo CSV deben asignarse a su esquema.

  • Cada registro de su archivo CSV debe estar en una sola línea.

  • Los tipos de datos de cada columna deben asignarse a su esquema. Si usa Data Wrangler para aplicar formato a sus datos, puede usar la transformación de Data Wrangler Analizar valor como tipo para convertir los tipos de datos.

  • Los datos de TIMESTAMP y CREATION_TIMESTAMP deben estar en formato de tiempo UNIX. Para obtener más información, consulte Datos de marca temporal.

  • Si sus datos incluyen caracteres codificados que no son ASCII, su archivo CSV debe estar codificado en formato UTF-8.

  • Asegúrese de aplicar formato a los datos textuales tal y como se describe en Metadatos de texto no estructurado.

  • Asegúrese de aplicar formato a los datos de impresión y los datos categóricos como se describe en Formato de impresiones explícitas y Formato de datos categóricos.

Para obtener más información sobre los requisitos de formato de datos masivos para Amazon Personalize, consulte Directrices de formato de datos.

Tras importar los datos a un conjunto de datos de Amazon Personalize, para analizarlos, exportarlos a un bucket de Amazon S3, eliminarlos o actualizarlos, elimine el conjunto de datos. Para obtener más información, consulte Administrar datos.

Si ya ha creado un recomendador o ha implementado una versión de solución personalizada con una campaña, la forma en que los nuevos registros masivos influyen en las recomendaciones depende del caso de uso del dominio o de la receta que utilice. Para obtener más información, consulte Influencia de los nuevos datos en las recomendaciones en tiempo real.

Filtrar las actualizaciones para los registros masivos

A los 20 minutos de completar una importación masiva, Amazon Personalize actualiza todos los filtros que haya creado en el grupo de conjuntos de datos con sus nuevos datos de usuario y elemento. Esta actualización permite a Amazon Personalize utilizar los datos más recientes al filtrar las recomendaciones para sus usuarios.