AWS Clean Rooms ML - AWS Clean Rooms

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

AWS Clean Rooms ML

AWS Clean Rooms El aprendizaje automático proporciona un método que preserva la privacidad para que dos partes identifiquen a usuarios similares en sus datos sin necesidad de compartir sus datos entre sí. La primera parte aporta los datos de entrenamiento a AWS Clean Rooms para que puedan crear y configurar un modelo similar y asociarlo a una colaboración. Luego, los datos iniciales se incorporan a la colaboración para crear un segmento similar similar a los datos de entrenamiento.

Para obtener una explicación más detallada de cómo funciona esto, consulte Trabajos entre cuentas

  • Proveedor de datos de entrenamiento: la parte que aporta los datos de entrenamiento, crea y configura un modelo similar y, a continuación, lo asocia a una colaboración.

  • Proveedor de datos iniciales: la parte que aporta los datos iniciales, genera un segmento similar y exporta su segmento similar.

  • Datos de entrenamiento: los datos del proveedor de datos de entrenamiento, que se utilizan para generar un modelo similar. Los datos de entrenamiento se utilizan para medir la similitud en los comportamientos de los usuarios.

    Los datos de entrenamiento deben contener un ID de usuario, un ID de elemento y una columna de marca de tiempo. De forma opcional, los datos de entrenamiento pueden contener otras interacciones, como características numéricas o categóricas. Algunos ejemplos de interacciones son una lista de los vídeos visualizados, los artículos comprados o los artículos leídos.

  • Datos iniciales: los datos del proveedor de datos iniciales, que se utilizan para crear un segmento similar. Los datos iniciales se pueden proporcionar directamente o pueden provenir de los resultados de un AWS Clean Rooms consulta. El resultado del segmento similar es un conjunto de usuarios a partir de los datos de entrenamiento que se parece más a los usuarios iniciales.

  • Modelo similar: un modelo de machine learning de los datos de entrenamiento que se utiliza para encontrar usuarios similares en otros conjuntos de datos.

    Cuando se usa elAPI, el término modelo de audiencia se usa de manera equivalente al modelo similar. Por ejemplo, se utiliza CreateAudienceModelAPIpara crear un modelo similar.

  • Segmento similar: un subconjunto de los datos de entrenamiento que más se parece a los datos iniciales.

    Al usar elAPI, se crea un segmento similar con. StartAudienceGenerationJobAPI

Los datos del proveedor de datos de entrenamiento nunca se comparten con el proveedor de datos iniciales, y viceversa. La salida del segmento similar se comparte con el proveedor de datos de entrenamiento, pero nunca con el proveedor de datos iniciales.

Para obtener más información acerca de los modelos similares, consulte los temas siguientes.

Cómo AWS Clean Rooms ML funciona

Una descripción general de cómo AWS Clean Rooms El aprendizaje automático funciona.

Clean Rooms ML requiere que dos partes, un proveedor de datos de formación y un proveedor de datos iniciales, trabajen secuencialmente en AWS Clean Rooms para integrar sus datos en una colaboración. Este es el flujo de trabajo que el proveedor de datos de entrenamiento debe completar primero:

  1. Los datos del proveedor de datos de formación deben almacenarse en un AWS Glue tabla del catálogo de datos sobre las interacciones entre usuarios y elementos. Como mínimo, los datos de entrenamiento deben contener una columna de ID de usuario, una columna de ID de interacción y una columna de fecha y hora.

  2. El proveedor de datos de entrenamiento registra los datos de entrenamiento con AWS Clean Rooms.

  3. El proveedor de datos de entrenamiento crea un modelo similar que se puede compartir con varios proveedores de datos iniciales. El modelo similar es una red neuronal profunda que puede tardar hasta 24 horas en entrenarse. No se reentrena automáticamente y te recomendamos que vuelvas a entrenar el modelo una vez por semana.

  4. El proveedor de datos de entrenamiento configura el modelo similar, que incluye si desea compartir las métricas de relevancia y la ubicación en Amazon S3 de los segmentos de salida. El proveedor de datos de entrenamiento puede crear varios modelos similares configurados a partir de un único modelo similar.

  5. El proveedor de datos de entrenamiento asocia el modelo de audiencia configurado a una colaboración que se comparte con un proveedor de datos iniciales.

Este es el flujo de trabajo que el proveedor de datos iniciales debe completar a continuación:

  1. Los datos del proveedor de datos iniciales se pueden almacenar en un bucket de Amazon S3 y pueden provenir de los resultados de la consulta.

  2. El proveedor de datos iniciales comienza la colaboración que comparte con el proveedor de datos de entrenamiento.

  3. El proveedor de datos iniciales crea un segmento similar en la pestaña Clean Rooms ML de la página de colaboración.

  4. El proveedor de datos iniciales puede evaluar las métricas de relevancia, si se compartieron, y exportar el segmento similar para usarlo fuera AWS Clean Rooms.