AWS Clean Rooms ML - AWS Clean Rooms

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

AWS Clean Rooms ML

AWS Clean Rooms ML

AWS Clean Rooms ML fornisce un metodo di tutela della privacy che consente a due parti di identificare utenti simili nei propri dati senza la necessità di condividerli tra loro. La prima parte fornisce i dati di formazione AWS Clean Rooms in modo che possano creare e configurare un modello simile e associarlo a una collaborazione. La seconda parte trasferisce quindi i propri dati iniziali AWS Clean Rooms e genera un segmento simile ai dati di addestramento.

Per una spiegazione più dettagliata di come funziona, vedi. Lavori su più account

  • Fornitore di dati di formazione: la parte che fornisce i dati di formazione, crea e configura un modello simile e quindi associa tale modello a una collaborazione.

  • Fornitore di dati iniziali: la parte che fornisce i dati iniziali, genera un segmento simile ed esporta il segmento simile.

  • Dati di formazione: i dati del fornitore dei dati di formazione, utilizzati per generare un modello simile. I dati di addestramento vengono utilizzati per misurare la somiglianza nei comportamenti degli utenti.

    I dati di addestramento devono contenere un ID utente, un ID articolo e una colonna con timestamp. Facoltativamente, i dati di allenamento possono contenere altre interazioni come caratteristiche numeriche o categoriali. Esempi di interazioni sono un elenco di video guardati, articoli acquistati o articoli letti.

  • Dati iniziali: i dati del fornitore di dati iniziali, utilizzati per creare un segmento simile. L'output del segmento lookalike è un insieme di utenti tratto dai dati di addestramento che assomiglia di più agli utenti seed.

  • Modello Lookalike: un modello di apprendimento automatico dei dati di addestramento utilizzato per trovare utenti simili in altri set di dati.

    Quando si utilizza l'API, il termine modello di audience viene utilizzato in modo equivalente al modello lookalike. Ad esempio, si utilizza l'CreateAudienceModelAPI per creare un modello simile.

  • Segmento simile: un sottoinsieme dei dati di addestramento che più assomiglia ai dati iniziali.

    Quando si utilizza l'API, si crea un segmento simile con l'API. StartAudienceGenerationJob

I dati del fornitore di dati di addestramento non vengono mai condivisi con il fornitore di dati di avviamento e i dati del fornitore di dati di avviamento non vengono mai condivisi con il fornitore di dati di formazione. L'output del segmento simile viene condiviso con il fornitore dei dati di addestramento, ma mai con il fornitore di dati iniziali.

Per ulteriori informazioni sui modelli simili, consultate i seguenti argomenti.

Come funziona il machine learning AWS Clean Rooms

Una panoramica di come funziona il AWS Clean Rooms ML..

Clean Rooms ML richiede che due parti, un fornitore di dati di formazione e un fornitore di dati iniziali, collaborino in sequenza AWS Clean Rooms per portare i propri dati in una collaborazione. Questo è il flusso di lavoro che il fornitore di dati di formazione deve completare per primo:

  1. I dati del fornitore di dati di formazione devono essere archiviati in una tabella del catalogo AWS Glue dati contenente le interazioni tra utenti e elementi. Come minimo, i dati di addestramento devono contenere una colonna ID utente, una colonna ID di interazione e una colonna timestamp.

  2. Il fornitore di dati di formazione registra i dati di allenamento con. AWS Clean Rooms

  3. Il fornitore di dati di formazione crea un modello simile che può essere condiviso con più fornitori di dati iniziali. Il modello Lookalike è una rete neurale profonda che può impiegare fino a 24 ore per addestrarsi. Non viene riaddestrato automaticamente e ti consigliamo di riaddestrare il modello settimanalmente.

  4. Il fornitore di dati di formazione configura il modello lookalike, incluso se condividere i parametri di pertinenza e la posizione in Amazon S3 dei segmenti di output. Il fornitore di dati di formazione può creare più modelli simili configurati a partire da un unico modello simile.

  5. Il fornitore di dati di formazione associa il modello di audience configurato a una collaborazione condivisa con un fornitore di dati iniziali.

Questo è il flusso di lavoro che il fornitore di dati iniziali deve completare successivamente:

  1. I dati del fornitore di dati iniziali devono essere archiviati in un bucket Amazon S3.

  2. Il fornitore di dati di avviamento avvia la collaborazione che condivide con il fornitore di dati di formazione.

  3. Il fornitore di dati iniziali crea un segmento simile dalla scheda Clean Rooms ML della pagina di collaborazione.

  4. Il fornitore di dati iniziali può valutare le metriche di pertinenza, se sono state condivise, ed esportare il segmento simile per utilizzarlo all'esterno. AWS Clean Rooms