Receta SIMS - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Receta SIMS

nota

Todas las recetas RELATED_ITEMS utilizan datos de interacciones. Elija SIMS si desea configurar más hiperparámetros para el modelo. Elija Receta Similar-Items si tiene metadatos de elementos y quiere que Amazon Personalize los use para buscar elementos similares.

La receta I tem-to-item similaridades (SIMS) utiliza el filtrado colaborativo para recomendar los elementos que se parecen más a los elementos que especificas al recibir recomendaciones. SIMS utiliza su conjunto de datos de interacciones de elementos, no los metadatos de los elementos, como el color o el precio, para determinar la similitud. SIMS identifica la presencia simultánea del elemento en los historiales de los usuarios de su conjunto de datos de interacciones para recomendar elementos similares. Por ejemplo, con SIMS, Amazon Personalize podría recomendar elementos de cafetería que los clientes compren juntos con frecuencia o películas que otros usuarios también hayan visto.

Cuando obtenga recomendaciones de elementos similares, puede filtrarlos en función de un atributo del elemento que especifique en la solicitud. Para ello, añada un elemento CurrentItem.attribute al filtro. Para ver un ejemplo, consulte item data filter examples.

Para usar SIMS, debe crear un conjunto de datos de interacciones de elementos con al menos 1000 interacciones históricas y de eventos únicas (combinadas). SIMS no utiliza los datos de un conjunto de datos de usuarios o elementos al generar recomendaciones. Aún puede filtrar las recomendaciones en función de los datos de estos conjuntos de datos. Para obtener más información, consulte Recomendaciones de filtrado y segmentos de usuarios.

Si no hay suficientes datos sobre el comportamiento de los usuarios para un elemento o no se encuentra el identificador del elemento que ha proporcionado, SIMS le recomendará los elementos más populares. Después de crear una versión de la solución, asegúrese de mantener la versión y los datos de la solución actualizados. Con SIMS, debe crear manualmente una nueva versión de la solución (volver a entrenar el modelo) para que Amazon Personalize considere nuevos elementos a modo de recomendaciones y actualice el modelo con el comportamiento más reciente del usuario. A continuación, debe actualizar cualquier campaña con la versión de la solución. Para obtener más información, consulte Mantenimiento de la relevancia de las recomendaciones.

La receta SIMS incluye las siguientes propiedades:

  • Nombre: aws-sims

  • Nombre de recurso de Amazon (ARN) de la receta: arn:aws:personalize:::recipe/aws-sims

  • ARN del algoritmo: arn:aws:personalize:::algorithm/aws-sims

  • ARN de transformación de características: arn:aws:personalize:::feature-transformation/sims

  • Tipo de receta: RELATED_ITEMS

En la siguiente tabla se describen los hiperparámetros de la receta SIMS. Un hiperparámetro es un parámetro de algoritmo que se puede ajustar para mejorar el rendimiento del modelo. Los hiperparámetros de algoritmos controlan el rendimiento del modelo. Los hiperparámetros de caracterización controlan cómo se filtran los datos que se van a utilizar en el entrenamiento. El proceso de elección del mejor valor para un hiperparámetro se denomina optimización de hiperparámetros (HPO). Para obtener más información, consulte Hiperparámetros y HPO.

La tabla también proporciona la siguiente información para cada hiperparámetro:

  • Rango: [límite inferior, límite superior]

  • Tipo de valor: número entero, continuo (flotante), categórico (booleano, lista, cadena)

  • HPO ajustable: ¿puede el parámetro participar en optimización hiperparámetros (HPO)?

Nombre Descripción
Hiperparámetros de algoritmos
popularity_discount_factor

Configure cómo la popularidad influye en las recomendaciones. Especifique un valor cercano a cero para incluir los elementos más populares. Especifique un valor cercano a uno para hacer menos hincapié en la popularidad.

Valor predeterminado: 0,5

Rango: [0,0, 1,0]

Tipo de valor: flotante

HPO ajustable: sí

min_cointeraction_count

El número mínimo de cointeracciones que necesita para calcular la similitud entre un par de elementos. Por ejemplo, un valor de 3 significa que necesita tres o más usuarios que interactuaron con ambos elementos para que el algoritmo calcule su similitud.

Valor predeterminado: 3

Rango: [0, 10].

Tipo de valor: entero

HPO ajustable: sí

Hiperparámetros de caracterización
min_user_history_length_percentile

El percentil mínimo de longitudes de historial de usuario para incluir en el entrenamiento de modelos. La longitud del historial es la cantidad total de datos disponibles de un usuario. Utilice min_user_history_length_percentile para excluir un porcentaje de usuarios con longitudes de historial cortas. Los usuarios con un historial corto suelen mostrar patrones basados en la popularidad de los elementos en lugar de sus necesidades o deseos personales. Eliminarlos puede entrenar modelos que se centren más en los patrones subyacentes de los datos. Elija un valor adecuado después de revisar las longitudes del historial de usuarios, utilizando un histograma o una herramienta similar. Recomendamos establecer un valor que retenga a la mayoría de los usuarios, pero que elimine los casos de borde.

Valor predeterminado: 0,005

Rango: [0,0, 1,0]

Tipo de valor: flotante

HPO ajustable: no

max_user_history_length_percentile

El percentil máximo de longitudes de historial de usuario para incluir en el entrenamiento de modelos. La longitud del historial es la cantidad total de datos disponibles en un usuario. Utilice max_user_history_length_percentile para excluir un porcentaje de usuarios con longitudes de historial largas. Los usuarios con un historial largo tienden a contener ruido. Por ejemplo, un robot podría tener una larga lista de interacciones automatizadas. La eliminación de estos usuarios limita el ruido en el entrenamiento. Elija un valor adecuado después de revisar las longitudes del historial de usuarios mediante un histograma o una herramienta similar. Recomendamos establecer un valor que retenga la mayoría de los usuarios, pero que elimine los casos de borde.

Por ejemplo, min_hist_length_percentile = 0.05 y max_hist_length_percentile = 0.95 incluyen todos los usuarios excepto aquellos cuyas longitudes de historial están en el 5 % inferior o superior.

Valor predeterminado: 0,995

Rango: [0,0, 1,0]

Tipo de valor: flotante

HPO ajustable: no

min_item_interaction_count_percentile

El percentil mínimo de interacción del elemento cuenta para incluirlo en el modelo de entrenamiento. Utilice min_item_interaction_count_percentile para excluir un porcentaje de elementos con un historial breve de interacciones. Los elementos con un historial breve suelen ser elementos nuevos. Eliminarlos permite entrenar modelos que se centren más en elementos con un historial conocido. Elija un valor adecuado después de revisar las longitudes del historial de usuarios, utilizando un histograma o una herramienta similar. Recomendamos establecer un valor que retenga la mayoría de los elementos, pero que elimine los casos de borde.

Valor predeterminado: 0,01

Rango: [0,0, 1,0]

Tipo de valor: flotante

HPO ajustable: no

max_item_interaction_count_percentile

El percentil máximo de interacción del elemento cuenta para incluirlo en el modelo de entrenamiento. Utilice max_item_interaction_count_percentile para excluir un porcentaje de elementos con un largo historial de interacciones. Los elementos con un historial largo tienden a ser más antiguos y podrían estar obsoletos. Por ejemplo, una película que está agotada. La eliminación de estos elementos permite centrarse en elementos más relevantes. Elija un valor adecuado después de revisar las longitudes del historial de usuarios mediante un histograma o una herramienta similar. Recomendamos configurar un valor que retenga la mayoría de los elementos, pero elimine los casos de borde.

Por ejemplo, min_item_interaction_count_percentile = 0.05 y max_item_interaction_count_percentile = 0.95 incluyen todos los elementos excepto aquellos con un recuento de interacción que esté en el 5 % inferior o superior.

Valor predeterminado: 0,9

Rango: [0,0, 1,0]

Tipo de valor: flotante

HPO ajustable: no

Cuaderno de ejemplo de SIMS

Para ver un cuaderno de Jupyter de muestra que describe cómo utilizar la receta SIMS, consulte Búsqueda de elementos similares + HPO.