Receta HRNN-ColdStart (heredada) - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Receta HRNN-ColdStart (heredada)

nota

Las recetas heredadas de HRNN ya no están disponibles. Esta documentación sirve como referencia.

Recomendamos que utilice la receta aws-user-personalizaton (User-Personalization) en lugar de las recetas heredadas de HRNN. User-Personalization mejora y unifica la funcionalidad que ofrecen las recetas HRNN. Para obtener más información, consulte Receta User-Personalization.

Utilice la receta HRNN-Coldstart para predecir los elementos con los que interactuará un usuario cuando añada nuevos elementos e interacciones con frecuencia y desee recibir recomendaciones para esos elementos de inmediato. La receta HRNN-Coldstart es similar a la receta HRNN-Metadata, pero le permite obtener recomendaciones de nuevos elementos.

Además, puede utilizar la receta HRNN-Coldstart cuando desee excluir del entrenamiento los elementos que tengan una larga lista de interacciones, ya sea porque se trate de una tendencia de popularidad reciente o porque las interacciones podrían ser muy inusuales e introducir ruido en el entrenamiento. Con HRNN-Coldstart, puede filtrar los elementos menos relevantes y crear un subconjunto para el entrenamiento. El subconjunto de elementos, que se denominan elementos fríos, son elementos que tienen eventos de interacción relacionados en el conjunto de datos de interacciones de elementos. Un elemento se considera un elemento frío cuando tiene:

  • Menos interacciones que un número máximo de interacciones especificado. Especifique este valor en el hiperparámetro cold_start_max_interactions de la receta.

  • Una duración relativa más corta que la duración máxima. Especifique este valor en el hiperparámetro cold_start_max_duration de la receta.

Para reducir el número de elementos fríos, establezca un valor inferior para cold_start_max_interactions o cold_start_max_duration. Para aumentar el número de elementos fríos, establezca un valor mayor para cold_start_max_interactions o cold_start_max_duration.

HRNN-Coldstart presenta los siguientes límites de elementos fríos:

  • Maximum cold start items: 80 000

  • Minimum cold start items: 100

Si el número de elementos fríos está fuera de este rango, se producirá un error en los intentos de crear una solución.

La receta HRNN-Coldstart incluye las siguientes propiedades:

  • Nombre: aws-hrnn-coldstart

  • Nombre de recurso de Amazon (ARN) de la receta: arn:aws:personalize:::recipe/aws-hrnn-coldstart

  • ARN del algoritmo: arn:aws:personalize:::algorithm/aws-hrnn-coldstart

  • ARN de transformación de características: arn:aws:personalize:::feature-transformation/featurize_coldstart

  • Tipo de receta: USER_PERSONALIZATION

Para obtener más información, consulte Elección de una receta.

En la siguiente tabla se describen los hiperparámetros de la receta HRNN-Coldstart. Un hiperparámetro es un parámetro de algoritmo que se puede ajustar para mejorar el rendimiento del modelo. Los hiperparámetros de algoritmos controlan el rendimiento del modelo. Los hiperparámetros de caracterización controlan cómo se filtran los datos que se van a utilizar en el entrenamiento. El proceso de elección del mejor valor para un hiperparámetro se denomina optimización de hiperparámetros (HPO). Para obtener más información, consulte Hiperparámetros y HPO.

La tabla también proporciona la siguiente información para cada hiperparámetro:

  • Rango: [límite inferior, límite superior]

  • Tipo de valor: número entero, continuo (flotante), categórico (booleano, lista, cadena)

  • HPO ajustable: ¿puede el parámetro participar en HPO?

Nombre Descripción
Hiperparámetros de algoritmos
hidden_dimension

El número de variables ocultas utilizadas en el modelo. Las variables ocultas recrean el historial de compras de los usuarios y las estadísticas de los elementos para generar puntuaciones de clasificación. Especifique un número mayor de dimensiones ocultas cuando el conjunto de datos de interacciones de elementos incluya patrones más complicados. El uso de más dimensiones ocultas requiere un conjunto de datos mayor y más tiempo de procesamiento. Para decidir el valor óptimo, utilice HPO. Para utilizar HPO, establezca performHPO en true cuando llame a las operaciones CreateSolution y CreateSolutionVersion.

Valor predeterminado: 149

Rango: [32, 256]

Tipo de valor: entero

HPO ajustable: sí

bptt

Determina si se debe utilizar la propagación hacia atrás a través de la técnica de tiempo. La propagación hacia atrás a través del tiempo es una técnica que actualiza ponderaciones en algoritmos basados en redes neuronales recurrentes. Utilice bptt para créditos a largo plazo para conectar recompensas retrasadas a eventos tempranos. Por ejemplo, una recompensa retrasada puede ser una compra realizada después de varios clics. Un evento temprano puede ser un clic inicial. Incluso dentro de los mismos tipos de eventos, tales como un clic, es buena idea tener en cuenta los efectos a largo plazo y maximizar las recompensas totales. Para tener en cuenta los efectos a largo plazo, utilice valores mayores de bptt. El uso de un valor de bptt mayor requiere conjuntos de datos más grandes y más tiempo de procesamiento.

Valor predeterminado: 32

Rango: [2, 32]

Tipo de valor: entero

HPO ajustable: sí

recency_mask

Determina si el modelo debe tener en cuenta las últimas tendencias de popularidad en el conjunto de datos de interacciones de elementos. Las últimas tendencias de popularidad pueden incluir cambios bruscos en los patrones subyacentes de los eventos de interacción. Para entrenar un modelo que tenga más peso sobre los eventos recientes, establezca recency_mask en true. Para entrenar un modelo que pesa igualmente todas las interacciones anteriores, establezca recency_mask en false. Para obtener buenas recomendaciones con el mismo peso, es posible que necesite un conjunto de datos de entrenamiento mayor.

Valor predeterminado: True

Rango: True o False

Tipo de valor: booleano

HPO ajustable: sí

Hiperparámetros de caracterización
cold_start_max_interactions

El número máximo de interacciones de usuario-elemento que puede tener un elemento para que se considere un elemento frío.

Valor predeterminado: 15

Rango: enteros positivos

Tipo de valor: entero

HPO ajustable: no

cold_start_max_duration

La duración máxima en días en relación con el punto de partida para que una interacción usuario-elemento se considere un elemento de arranque en frío. Para establecer el punto de partida de la interacción usuario-elemento, establezca el hiperparámetro cold_start_relative_from.

Valor predeterminado: 5,0

Rango: flotantes positivos

Tipo de valor: flotante

HPO ajustable: no

cold_start_relative_from

Determina el punto de partida para que la receta HRNN-Coldstart calcule cold_start_max_duration. Para calcular a partir de la hora actual, elija currentTime.

Para calcular cold_start_max_duration a partir de la marca de tiempo del último elemento en el conjunto de datos de interacciones de elementos, elija latestItem. Esto resulta útil si añade elementos nuevos con frecuencia.

Valor predeterminado: latestItem

Rango: currentTime, latestItem

Tipo de valor: cadena

HPO ajustable: no

min_user_history_length_percentile

El percentil mínimo de longitudes de historial de usuario para incluir en el entrenamiento de modelos. La longitud del historial es la cantidad total de datos sobre un usuario. Utilice min_user_history_length_percentile para excluir un porcentaje de usuarios con longitudes de historial cortas. Los usuarios con un historial corto suelen mostrar patrones basados en la popularidad de los elementos en lugar de sus necesidades o deseos personales. Eliminarlos puede entrenar modelos que se centren más en los patrones subyacentes de los datos. Elija un valor adecuado después de revisar las longitudes del historial de usuarios, utilizando un histograma o una herramienta similar. Recomendamos establecer un valor que retenga a la mayoría de los usuarios, pero que elimine los casos de borde.

Por ejemplo, al establecer min__user_history_length_percentile to 0.05 y max_user_history_length_percentile to 0.95 se incluyen todos los usuarios, excepto los que tienen longitudes de historial en el 5 % inferior o superior.

Valor predeterminado: 0,0

Rango: [0,0, 1,0]

Tipo de valor: flotante

HPO ajustable: no

max_user_history_length_percentile

El percentil máximo de longitudes de historial de usuario para incluir en el entrenamiento de modelos. La longitud del historial es la cantidad total de datos sobre un usuario. Utilice max_user_history_length_percentile para excluir un porcentaje de usuarios con longitudes de historial largas, ya que los datos de estos usuarios tienden a contener ruido. Por ejemplo, un robot podría tener una larga lista de interacciones automatizadas. La eliminación de estos usuarios limita el ruido en el entrenamiento. Elija un valor adecuado después de revisar las longitudes del historial de usuarios mediante un histograma o una herramienta similar. Recomendamos establecer un valor que retenga la mayoría de los usuarios, pero que elimine los casos de borde.

Por ejemplo, al establecer min__user_history_length_percentile to 0.05 y max_user_history_length_percentile to 0.95 se incluyen todos los usuarios, excepto los que tienen longitudes de historial en el 5 % inferior o superior.

Valor predeterminado: 0,99

Rango: [0,0, 1,0]

Tipo de valor: flotante

HPO ajustable: no