Conjunto de datos de interacciones de elementos - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conjunto de datos de interacciones de elementos

La interacción entre un artículo es un evento de interacción positiva entre un usuario y un artículo de tu catálogo. Por ejemplo, un usuario que ve una película, ve un anuncio o compra un par de zapatos. Debe importar los datos sobre las interacciones de los usuarios con sus elementos en un conjunto de datos de interacciones de elementos. Puede registrar varios tipos de eventos, como hacer clic, ver o me gusta.

Por ejemplo, si un usuario hace clic en un elemento concreto y, a continuación, da a me gusta en el elemento, puede hacer que Amazon Personalize utilice estos eventos como datos de entrenamiento. Para cada evento, registraría el ID del usuario, el ID del elemento, la marca de tiempo (en formato de tiempo Unix) y el tipo de evento (hacer clic y me gusta). A continuación, se agregarían ambos eventos de interacción de elementos a un conjunto de datos de interacciones de elementos.

Para todos los casos de uso (grupos de conjuntos de datos de dominio) y recetas (recursos personalizados), sus datos de interacciones de elementos deben tener lo siguiente:

  • Como mínimo, 1000 registros de interacciones de elementos de los usuarios que interactúan con los elementos de su catálogo. Estas interacciones pueden provenir de importaciones masivas, de eventos transmitidos o ambos.

  • Como mínimo, 25 ID de usuarios únicos con al menos dos interacciones de elementos para cada uno.

Para obtener recomendaciones de calidad, le sugerimos que tenga al menos 50 000 interacciones de elementos de al menos 1000 usuarios, con dos o más interacciones de elementos cada uno.

Para crear un recomendador o una solución personalizada, debe crear como mínimo un conjunto de datos de interacciones de elementos. En esta sección se proporciona información acerca de los siguientes tipos de datos de interacciones de elementos que puede importar en Amazon Personalize.

Datos de valor de evento y tipo de evento

Un conjunto de datos de interacciones entre elementos puede almacenar datos sobre el tipo de evento y el valor del evento para cada interacción. Solo los recursos personalizados utilizan datos de valores de eventos.

Datos de tipo de evento

Amazon Personalize utiliza datos de tipo de evento, como datos de clics o compras, para identificar la intención y el interés del usuario. Si creas recomendadores de dominios, todos los casos de uso requieren datos sobre el tipo de evento. Algunos casos de uso requieren tipos de eventos específicos. Tiene libertad para utilizar otros tipos de eventos adicionales. Para más información, consulte Elección de un caso de uso.

Si crea recursos personalizados, puede elegir los eventos que se utilizarán para la formación por tipo de evento. Si su conjunto de datos tiene varios tipos de eventos en una columna EVENT_TYPE y no proporciona un tipo de evento al configurar una solución personalizada, Amazon Personalize utiliza todos los datos de interacciones de los elementos para el entrenamiento con el mismo peso, independientemente del tipo. Para obtener más información, consulte Elección de los datos de interacciones de elementos utilizados para el entrenamiento.

Tipos de eventos positivos y negativos

Amazon Personalize asume que cualquier interacción es positiva. Las interacciones con un tipo de evento negativo, como una aversión, no impedirán necesariamente que el artículo aparezca en las recomendaciones futuras del usuario.

Las siguientes son formas de hacer que los eventos negativos y el desinterés de los usuarios influyan en las recomendaciones:

Datos sobre el valor de los eventos (recursos personalizados)

Los datos del valor del evento pueden ser el porcentaje de una película que ha visto un usuario o una valoración sobre 10. Si crea soluciones personalizadas e importa los datos del valor del evento junto con los datos del tipo de evento, puede elegir los registros que se utilizarán para el entrenamiento en función del tipo y el valor. Con los recomendadores de dominios, Amazon Personalize no utiliza datos sobre el valor de los eventos y no puedes filtrarlos antes del entrenamiento.

Para elegir registros en función del tipo y el valor, registre un tipo de evento y un valor de evento para cada evento. El valor que elija para cada evento depende de los datos que desee excluir y de los tipos de eventos que vaya a registrar. Por ejemplo, puede hacer coincidir la actividad del usuario, como el porcentaje de vídeo que ha visto el usuario, para los tipos de eventos ver.

Al configurar una solución, se establece un valor específico como umbral para excluir los registros del entrenamiento. Por ejemplo, si los datos EVENT_VALUE de los eventos con un EVENT_TYPE de ver son el porcentaje de un vídeo que ha visto un usuario, si establece el umbral del valor del evento en 0,5 y el tipo de evento en ver, Amazon Personalize entrena el modelo utilizando únicamente eventos de interacción ver con un EVENT_VALUE superior o igual a 0,5.

Para obtener más información, consulte Elección de los datos de interacciones de elementos utilizados para el entrenamiento.

Metadatos contextuales

Con determinadas recetas y casos de uso de generadores de recomendaciones, Amazon Personalize puede utilizar metadatos contextuales para identificar los patrones subyacentes que revelan los elementos más relevantes para sus usuarios. Los metadatos contextuales son datos de interacciones que se recopilan en el entorno del usuario en el momento de un evento, como su ubicación o el tipo de dispositivo.

La inclusión de metadatos contextuales le permite ofrecer una experiencia más personalizada a los usuarios actuales. Por ejemplo, si los clientes compran de manera diferente cuando acceden a su catálogo desde un teléfono que si lo hacen desde un ordenador, incluya metadatos contextuales sobre el dispositivo del usuario. De este modo, las recomendaciones serán más relevantes en función de la forma en que estén navegando.

Además, los metadatos contextuales ayudan a reducir la fase de arranque en frío para usuarios nuevos o no identificados. La fase de arranque en frío se refiere al período en el que el motor de recomendaciones proporciona recomendaciones menos relevantes debido a la falta de información histórica sobre ese usuario.

Para los grupos de conjuntos de datos de dominio, los siguientes casos de uso de generador de recomendaciones pueden utilizar metadatos contextuales:

En el caso de los recursos personalizados, entre las recetas que utilizan metadatos contextuales se incluyen las siguientes:

Para obtener más información sobre la información contextual, consulte la siguiente entrada del blog de AWS Machine Learning: Aumentar la relevancia de sus recomendaciones de Amazon Personalize mediante el aprovechamiento de la información contextual.

Datos de impresiones

Las impresiones son listas de elementos que estaban visibles para un usuario cuando interactuaba con un elemento concreto (por ejemplo, al hacer clic o verlo). Si utilizas un caso de uso de dominio que ofrezca la personalización o la User-Personalization receta, Amazon Personalize puede utilizar los datos de impresiones para guiar la exploración.

Con la exploración, las recomendaciones incluyen algunos elementos o acciones que, por lo general, es menos probable que se recomienden al usuario, como nuevos elementos o acciones, elementos o acciones con pocas interacciones, o bien elementos o acciones menos relevantes para el usuario en función de su comportamiento anterior. Cuanto más frecuente sea la aparición de un elemento en los datos de impresiones, menos probabilidades hay de que Amazon Personalize incluya el elemento en la exploración.

Cuando creas un recomendante o una solución, Amazon Personalize siempre excluye los datos de impresiones de la formación. Esto se debe a que Amazon Personalize no entrena tus modelos con datos de impresiones. En cambio, los usa cuando recibes recomendaciones para guiar la exploración para el usuario.

Los valores de impresión pueden tener como máximo 1000 caracteres (incluido el carácter de barra vertical). En el caso de los grupos de conjuntos de datos de dominio, los siguientes casos de uso recomendados pueden utilizar datos de impresiones:

Para obtener más información acerca de la exploración, consulte Exploration (Exploración). Amazon Personalize puede modelar dos tipos de impresiones: Impresiones implícitas y Impresiones explícitas.

Impresiones implícitas

Las impresiones implícitas son las recomendaciones, recuperadas de Amazon Personalize, que muestra al usuario. Puede integrarlas en su flujo de trabajo de recomendaciones incluyendo el RecommendationId (devuelto por las operaciones GetRecommendations y GetPersonalizedRanking) como entrada para futuras solicitudes de PutEvents. Amazon Personalize obtiene las impresiones implícitas en función de los datos de sus recomendaciones.

Por ejemplo, es posible que tenga una aplicación que proporcione recomendaciones para streaming en vídeo. El flujo de trabajo de recomendaciones que utiliza impresiones implícitas podría ser el siguiente:

  1. Solicita recomendaciones de vídeo para uno de sus usuarios mediante la operación de la API de GetRecommendations de Amazon Personalize.

  2. Amazon Personalize genera recomendaciones para el usuario que utiliza su modelo (versión de la solución) y las devuelve con un recommendationId en la respuesta de la API.

  3. Las recomendaciones de vídeo se muestran al usuario en su aplicación.

  4. Cuando el usuario interactúa con un vídeo (por ejemplo, hace clic en él), registra la elección en una llamada a la API de PutEvents e incluye el recommendationId como parámetro. Para ver una muestra de código, consulte Registro de datos de impresiones.

  5. Amazon Personalize utiliza el recommendationId para obtener los datos de impresión de las recomendaciones de vídeo anteriores y, a continuación, los utiliza para guiar la exploración, donde las recomendaciones futuras incluyen nuevos vídeos con menos datos de interacciones o relevancia.

    Para obtener más información sobre cómo registrar eventos con datos de impresiones implícitos, consulte Registro de datos de impresiones.

Impresiones explícitas

Las impresiones explícitas son impresiones que registra y envía manualmente a Amazon Personalize. Use impresiones explícitas para manipular los resultados de Amazon Personalize. El orden de los elementos no tiene ningún impacto.

Por ejemplo, es posible que tenga una aplicación de compras que ofrezca recomendaciones de zapatos. Si solo recomienda zapatos que se encuentren en stock actualmente, puede especificar estos elementos utilizando impresiones explícitas. Su flujo de trabajo de recomendaciones usando impresiones explícitas podría ser el siguiente:

  1. Solicite recomendaciones para uno de sus usuarios mediante la API de GetRecommendations de API Amazon Personalize.

  2. Amazon Personalize genera recomendaciones para el usuario que utiliza su modelo (versión de la solución) y las devuelve en la respuesta de la API.

  3. Al usuario se muestran solo los zapatos recomendados que están en stock.

  4. Para importar datos incrementales en tiempo real, cuando el usuario interactúa con un par de zapatos (por ejemplo, hace clic en ellos), registra la elección en una llamada a la API de PutEvents y enumera los elementos recomendados que se encuentran en stock en el parámetro impression. Para ver una muestra de código, consulte Registro de datos de impresiones.

    Para importar impresiones en los datos históricos de interacciones de elementos, puede enumerar las impresiones explícitas en su archivo csv y separar cada elemento con un carácter “|”. El carácter de la barra vertical cuenta para el límite de 1000 caracteres. Para ver un ejemplo, consulte Formato de impresiones explícitas.

  5. Amazon Personalize utiliza los datos de impresiones para guiar la exploración, donde las recomendaciones futuras incluyen nuevos zapatos con menos datos de interacciones o relevancia.