Trasformazione dei dati - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Trasformazione dei dati

Per trasformare i dati in Data Wrangler, aggiungi una fase di trasformazione al flusso di dati. Data Wrangler include oltre 300 trasformazioni che puoi utilizzare per preparare i tuoi dati, tra cui colonne Map per Amazon Personalize Transform. Inoltre, puoi utilizzare le trasformazioni generali di Data Wrangler per correggere problemi come valori anomali, problemi di tipo e valori mancanti.

Dopo aver finito di trasformare i dati, puoi analizzarli con Data Wrangler. Oppure, se hai finito di preparare i dati in Data Wrangler, puoi elaborarli e importarli in Amazon Personalize. Per informazioni sull'analisi dei dati, consulta. Generazione di visualizzazioni e approfondimenti sui dati Per informazioni sull'elaborazione e l'importazione dei dati, vedere. Elaborazione dei dati e loro importazione in Amazon Personalize

Colonne di mappatura per Amazon Personalize

Per trasformare i dati in modo che soddisfino i requisiti di Amazon Personalize, aggiungi le colonne Map per Amazon Personalize transform e mappa le colonne ai campi obbligatori e facoltativi di Amazon Personalize.

Per utilizzare le colonne della mappa per Amazon Personalize Transform
  1. Scegli + per la tua ultima trasformazione e scegli Aggiungi trasformazione. Se non hai aggiunto una trasformazione, scegli + per la trasformazione dei tipi di dati. Data Wrangler aggiunge questa trasformazione automaticamente al tuo flusso.

  2. Scegli Aggiungi fase.

  3. Scegli Transforms per Amazon Personalize. Le colonne della mappa per Amazon Personalize transform sono selezionate per impostazione predefinita.

  4. Usa i campi di trasformazione per mappare i dati agli attributi Amazon Personalize richiesti.

    1. Scegli il tipo di set di dati che corrisponde ai tuoi dati (interazioni, elementi o utenti).

    2. Scegli il tuo dominio (ECOMMERCE, VIDEO _ON_ DEMAND o personalizzato). Il dominio scelto deve corrispondere al dominio specificato al momento della creazione del gruppo di set di dati.

    3. Scegli le colonne che corrispondono ai campi obbligatori e facoltativi per Amazon Personalize. Ad esempio, per la colonna item_ID, scegli la colonna dei tuoi dati che memorizza le informazioni di identificazione uniche per ciascuno dei tuoi articoli.

      Ogni campo della colonna viene filtrato per tipo di dati. Sono disponibili solo le colonne dei dati che soddisfano i requisiti del tipo di dati di Amazon Personalize. Se i tuoi dati non sono del tipo richiesto, puoi utilizzare la trasformazione Parse Value as Type Data Wrangler per convertirli.

Trasformazioni di General Data Wrangler

Le seguenti trasformazioni generali di Data Wrangler possono aiutarti a preparare i dati per Amazon Personalize:

  • Conversione del tipo di dati: se il campo non è elencato come opzione possibile nelle colonne della mappa per Amazon Personalize transform, potrebbe essere necessario convertirne il tipo di dati. La trasformazione di Data Wrangler Parse Value as Type può aiutarti a convertire i tuoi dati. Oppure puoi utilizzare la trasformazione dei tipi di dati che Data Wrangler aggiunge per impostazione predefinita quando crei un flusso. Per utilizzare questa trasformazione, scegli il tipo di dati dagli elenchi a discesa Tipo, scegli Anteprima e quindi scegli Aggiorna.

    Per informazioni sui tipi di dati richiesti per i campi, consulta la sezione relativa al dominio e al tipo di set di dati. Schemi

  • Gestione dei valori mancanti e dei valori anomali: se generi valori mancanti o valori anomali, puoi utilizzare le trasformazioni di Data Wrangler Handle Outliers e Handle Missing Values per risolvere questi problemi.

  • Trasformazioni personalizzate: con Data Wrangler, puoi creare le tue trasformazioni con Python (funzione definita dall'utente) PySpark, panda o (). PySpark SQL È possibile utilizzare una trasformazione personalizzata per eseguire attività come eliminare colonne duplicate o raggruppare per colonne. Per ulteriori informazioni, consulta Custom Transforms nella Amazon SageMaker Developer Guide.