Elección de los datos de interacciones de elementos utilizados para el entrenamiento - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Elección de los datos de interacciones de elementos utilizados para el entrenamiento

importante

Después de crear una solución, no puede cambiar su configuración. De forma predeterminada, todas las soluciones nuevas utilizan el entrenamiento automático. Con la formación automática, incurrirá en costes de formación mientras la solución esté activa. Para evitar costes innecesarios, asegúrese de eliminar la solución cuando haya terminado. Para obtener información sobre los costes de formación, consulta los precios de Amazon Personalize.

Puede elegir los eventos de un conjunto de datos de interacciones de elementos que Amazon Personalize utiliza al crear una versión de la solución (entrenamiento de un modelo). La elección de los datos de interacciones de elementos antes del entrenamiento le permite usar solo un subconjunto relevante de los datos para el entrenamiento o eliminar ruido para entrenar un modelo más optimizado. Para obtener más información sobre los conjuntos de datos de interacciones de datos, consulte Schemas y Conjunto de datos de interacciones de elementos.

nota

Si utilizas user-Personalization-v2 o Personalized-Ranking-v2, el coste de la formación se basa en los datos de interacciones entre los productos antes de filtrarlos por tipo o valor de evento. Para obtener más información sobre los precios, consulta los precios de Amazon Personalize.

Puede elegir los datos de interacciones de elementos de la siguiente forma:

  • Elija los registros según el tipo: al configurar una solución, si su conjunto de datos de interacciones de elementos incluye tipos de eventos en una columna EVENT_TYPE, puede especificar de manera opcional un tipo de evento para usarlo en el entrenamiento. Por ejemplo, si su conjunto de datos de interacciones de elementos incluye tipos de eventos de compra, clic y visualización, y quiere que Amazon Personalize entrene el modelo solo para eventos de visualización, al configurar la solución, debe proporcionar visualización como el event type que Amazon Personalize usa en el entrenamiento.

    Si su conjunto de datos de interacciones de elementos tiene varios tipos de eventos en una columna EVENT_TYPE y no proporciona ningún tipo de evento al configurar la solución, Amazon Personalize utiliza todos los datos de interacciones de elementos para el entrenamiento con la misma ponderación, con independencia del tipo.

  • Elija los registros según el tipo y el valor: al configurar una solución, si su conjunto de datos de interacciones de elementos incluye los campos EVENT_TYPE y EVENT_VALUE, puede establecer un valor específico como umbral para excluir registros del entrenamiento. Por ejemplo, si los datos EVENT_VALUE de los eventos con un EVENT_TYPE de ver son el porcentaje de un vídeo que ha visto un usuario, si establece el umbral del valor del evento en 0,5 y el tipo de evento en ver, Amazon Personalize entrena el modelo utilizando únicamente eventos de interacción ver con un EVENT_VALUE superior o igual a 0,5.

El siguiente código muestra cómo usar el SDK para Python (Boto3) para crear una solución que use solo watch eventos en los que el usuario haya visto más de la mitad del vídeo.

import boto3 personalize = boto3.client('personalize') create_solution_response = personalize.create_solution( name = 'solution name', datasetGroupArn = 'arn:aws:personalize:region:accountId:dataset-group/datasetGroupName', recipeArn = 'arn:aws:personalize:::recipe/aws-user-personalization-v2', eventType = 'watch', solutionConfig = { "eventValueThreshold": "0.5" } ) # Store the solution ARN solution_arn = create_solution_response['solutionArn'] # Use the solution ARN to get the solution status solution_description = personalize.describe_solution(solutionArn = solution_arn)['solution'] print('Solution status: ' + solution_description['status'])