Preparazione e importazione di dati in blocco - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Preparazione e importazione di dati in blocco

Dopo aver creato un set di dati, sei pronto per iniziare a importare i tuoi dati storici in blocco in Amazon Personalize. Hai due scelte per importare i tuoi record in blocco:

  • Per quanto riguarda le interazioni con gli articoli, gli utenti e i set di SageMaker dati degli articoli, puoi utilizzare Amazon Data Wrangler per importare i dati da oltre 40 fonti, generare visualizzazioni e approfondimenti specifici di Amazon Personalize e trasformarli per soddisfare i requisiti di Amazon Personalize.

  • Per tutti i tipi di set di dati, puoi importare dati in blocco direttamente nei set di dati. Quando importi direttamente, formatti manualmente i dati per soddisfare i requisiti di Amazon Personalize e li carichi su Amazon S3. Quindi crei uno schema e un set di dati e importi i dati direttamente nel set di dati con un processo di importazione del set di dati.

Le seguenti linee guida possono aiutarti a garantire che i tuoi dati di massa siano formattati correttamente.

  • I dati di input devono essere contenuti in un file CSV (valori separati da virgole).

  • La prima riga del file CSV deve contenere le intestazioni delle colonne. Non racchiudere intestazioni tra virgolette (").

  • Assicurati di avere i campi obbligatori per il tipo di set di dati e assicurati che i loro nomi siano conformi ai requisiti di Amazon Personalize. Ad esempio, i dati Items potrebbero avere una colonna denominata ITEM_IDENTIFICATION_NUMBER con ID per ciascuno dei tuoi articoli. Per utilizzare questa colonna come campo ITEM_ID, rinomina la colonna in. ITEM_ID Se utilizzi Data Wrangler per formattare i tuoi dati, puoi utilizzare le colonne Map per la trasformazione di Amazon Personalize Data Wrangler per assicurarti che le colonne abbiano un nome corretto.

    Per informazioni sui campi obbligatori, consulta. Schemi Per informazioni sull'utilizzo di Data Wrangler per preparare i dati, consulta. Preparazione e importazione di dati con Amazon SageMaker Data Wrangler

  • I nomi delle intestazioni delle colonne nel file CSV devono corrispondere allo schema.

  • Ogni record del file CSV deve trovarsi su una sola riga.

  • I tipi di dati in ogni colonna devono corrispondere allo schema. Se si utilizza Data Wrangler per formattare i dati, è possibile utilizzare la trasformazione Data Wrangler Parse Value as Type per convertire i tipi di dati.

  • TIMESTAMPe CREATION_TIMESTAMP i dati devono essere in formato UNIX epoch time. Per ulteriori informazioni, consulta Dati relativi al timestamp.

  • Evita di includere " caratteri o caratteri speciali nei dati dell'ID dell'elemento, dell'ID utente e dell'ID dell'azione.

  • Se i dati includono caratteri non codificati in formato ASCII, il file CSV deve essere codificato in formato UTF-8.

  • Assicurati di formattare tutti i dati testuali come descritto in. Metadati di testo non strutturati

  • Assicurati di formattare i dati sulle impressioni e i dati categoriali come descritto in Formattazione delle impressioni esplicite e. Formattazione di dati categorici

Per ulteriori informazioni sui requisiti di formattazione di massa dei dati per Amazon Personalize, consulta. Linee guida sul formato dei dati

Dopo aver importato i dati in un set di dati Amazon Personalize, puoi analizzarli, esportarli in un bucket Amazon S3, aggiornarli o eliminarli eliminando il set di dati. Per ulteriori informazioni, consulta Gestione dei dati di addestramento nei set di dati.

Se hai già creato un programma di raccomandazione o distribuito una versione della soluzione personalizzata con una campagna, l'influenza dei nuovi record in blocco sui consigli dipende dal caso d'uso del dominio o dalla ricetta che utilizzi. Per ulteriori informazioni, consulta In che modo i nuovi dati influenzano le raccomandazioni in tempo reale.

Filtra gli aggiornamenti per i record in blocco

Entro 20 minuti dal completamento di un'importazione in blocco, Amazon Personalize aggiorna tutti i filtri creati nel gruppo di set di dati con il nuovo articolo e i dati utente. Questo aggiornamento consente ad Amazon Personalize di utilizzare i dati più recenti per filtrare i consigli per i tuoi utenti.