Fase 1: Preparazione dei dati - Amazon Machine Learning

Non aggiorniamo più il servizio Amazon Machine Learning né accettiamo nuovi utenti. Questa documentazione è disponibile per gli utenti esistenti, ma non la aggiorneremo più. Per ulteriori informazioni, consulta la paginaCos'è Amazon Machine Learning.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Fase 1: Preparazione dei dati

Nel machine learning, in genere è possibile ottenere i dati e assicurarsi che siano correttamente formattati prima di avviare il processo di addestramento. Ai fini del presente tutorial, abbiamo ottenuto un set di dati di esempio dalRepository UCI Machine Learning, formattandolo conformemente alle linee guida di Amazon ML e renendolo disponibile per il download. Scaricare il set di dati dal percorso di storage Amazon Simple Storage Service (Amazon S3) e caricarlo nel proprio bucket S3 seguendo le procedure indicate di seguito.

Per i requisiti di formattazione Amazon ML, consultareComprendere il formato dei dati per Amazon ML.

Per scaricare i set di dati
  1. Scaricare il file che contiene i dati cronologici dei clienti che hanno acquistato prodotti simili al deposito bancario a termine facendo clic su banking.zip. Decomprimere la cartella e salvare il file banking.csv sul computer.

  2. Scarica il file che userai per prevedere se i potenziali clienti risponderanno alla tua offerta facendo clic su banking-batch.zip. Decomprimere la cartella e salvare il file banking-batch.csv sul computer.

  3. Aprire banking.csv. Verranno visualizzate righe e colonne di dati. La riga di intestazione contiene i nomi degli attributi di ogni colonna. Un attributo è una proprietà denominata in modo univoco che descrive una determinata caratteristica di ciascun cliente; ad esempio, nr_employed indica lo stato lavorativo del cliente. Ogni riga rappresenta la raccolta delle osservazioni relative a un singolo cliente.

    Si vuole che il modello ML risponda alla domanda "Il cliente effettuerà la sottoscrizione al mio nuovo prodotto?". Nel set di dati banking.csv, la risposta a questa domanda è l'attributo y, che contiene i valori 1 (per sì) o 0 (per no). L'attributo che si vuole che Amazon ML apprenda a prevedere è noto comeattributo di destinazione.

    Nota

    L'attributo y è un attributo binario. Può contenere solo uno di due valori, in questo caso 0 o 1. Nel set di dati UCI originale, l'attributo y è Sì o No. Abbiamo modificato il set di dati originale per l'utente. Tutti i valori dell'attributo y che significano sì sono ora 1 e tutti i valori che significano no sono ora 0. Se si utilizzano propri dati, è possibile impiegare altri valori per un attributo binario. Per ulteriori informazioni sui valori validi, consultare Utilizzo del campo AttributeType.

I seguenti esempi mostrano i dati prima e dopo la modifica dei valori dell'attributo y in attributi binari 0 e 1.

Il file banking-batch.csv non contiene l'attributo y. Dopo aver creato un modello ML, si utilizzerà il modello per prevedere y per ciascun record di quel file.

Quindi, caricare ilbanking.csv ebanking-batch.csvfile in Amazon S3.

Caricare i file in un percorso Amazon S3
  1. Accedi alla AWS Management Console e apri la console di Amazon S3 all'indirizzo https://console.aws.amazon.com/s3/.

  2. Nell'elenco All Buckets (Tutti i bucket), creare un bucket o scegliere il percorso in cui si vogliono caricare i file.

  3. Nella barra di navigazione, scegliere Upload (Carica).

  4. Seleziona Aggiungi file.

  5. Nella finestra di dialogo, passare al desktop, scegliere banking.csv e banking-batch.csv, quindi Open (Apri).

Ora è possibile creare la propria origine dati di addestramento.