Fase 2: Creare un'origine dati di addestramento

Dopo aver caricato il filebanking.csvSet di dati nella propria posizione Amazon Simple Storage Service (Amazon S3), lo si può utilizzare per creare un'origine dati di addestramento. Un'origine dati è un oggetto Amazon Machine Learning (Amazon ML) che contiene il percorso dei dati di input e importanti metadata riguardo ai dati di input. Amazon ML utilizza l'origine dati per operazioni quali l'addestramento e la valutazione del modello ML.

Per creare un'origine dati, è necessario fornire quanto segue:

La posizione di Amazon S3 dei dati e l'autorizzazione per accedere ai dati
Lo schema, che include i nomi degli attributi dei dati e il tipo di ogni attributo (Numeric, Text, Categorical o Binary)
Il nome dell'attributo che contiene la risposta che si desidera che Amazon ML impari a prevedere, l'attributo di destinazione

Nota

Nell'origine dati non vengono memorizzati i dati, ma solo i riferimenti ad essi. Evitare di spostare o modificare i file archiviati in Amazon S3. Se si spostano o modificano tali file, Amazon ML non riesce ad accedervi per creare un modello ML, generare le valutazioni o generare le previsioni.

Per creare un'origine dati di addestramento

Aprire la console Amazon Machine Learning all'indirizzohttps://console.aws.amazon.com/machinelearning/.
Scegliere Get Started (Inizia).

Nota
Questo tutorial presuppone che si tratti del primo utilizzo di Amazon ML. Se hai già utilizzato Amazon ML, puoi usare ilCreazione di un nuovo...Un elenco a discesa nel pannello di controllo Amazon ML per creare una nuova origine dati.
SulInizia ad usare Amazon Machine Learningpagina, scegliereAvvio di.
Nella pagina Input Data (Dati di input), per Where is your data located? (Dove si trovano i tuoi dati?), assicurarsi che sia stato selezionato S3.
PerPercorso S3, digitare la posizione completa delbanking.csvdal passaggio 1: Preparazione dei dati. Ad esempio:bucket/banking.csv. Amazon ML anteduce ad s3://al nome del bucket per l'utente.
Per Datasource name (Nome origine dati), digitare Banking Data 1.
Selezionare Verify (Verifica).
Nella finestra di dialogo S3 permissions (Autorizzazioni S3), scegliere Yes (Sì).
Se Amazon ML riesce ad accedere e a leggere il file di dati nella posizione S3, verrà visualizzata una pagina simile alla seguente. Verificare le proprietà e scegliere Continue (Continua).

Dopo occorre stabilire uno schema. UNschemaè costituito dalle informazioni che servono ad Amazon ML per interpretare i dati di input per un modello ML, inclusi i nomi degli attributi speciali. Sono disponibili due modi per fornire uno schema ad Amazon ML:

Fornire un file di schema separato quando si caricano i dati Amazon S3.
Consentire ad Amazon ML di dedurre i tipi di attributo e di creare uno schema per l'utente.

In questo tutorial, chiederemo ad Amazon ML di dedurre lo schema.

Per informazioni sulla creazione di un file di schema separato, consultare Creazione di uno schema di dati per Amazon ML.

Per consentire ad Amazon ML di dedurre lo schema

SulSchema, Amazon ML mostra lo schema che ha dedotto. Esaminare i tipi di dati che Amazon ML ha dedotto per gli attributi. È importante che agli attributi sia assegnato il tipo di dati corretto, per aiutare Amazon ML ad acquisire correttamente i dati e abilitare la corretta elaborazione delle caratteristiche sugli attributi.
- Gli attributi che hanno solo due stati possibili, come ad esempio sì o no, devono essere contrassegnati come Binary (Binario).
- Gli attributi che sono numeri o stringhe utilizzati per denotare una categoria devono essere contrassegnati come Categorical (Categorico).
- Gli attributi che sono quantità numeriche per le quali l'ordine è significativo devono essere contrassegnati come Numeric (Numerico).
- Gli attributi che sono stringhe che si desidera trattare come parole delimitate da spazi devono essere contrassegnati come Text (Testo).
In questo tutorial, Amazon ML ha identificato correttamente i tipi di dati per tutti gli attributi, quindi scegliereContinua.

Quindi, selezionare un attributo di destinazione.

Ricordare che la destinazione è l'attributo che il modello ML deve imparare a prevedere. L'attributo y indica se un singolo ha aderito a una campagna in passato: 1 (sì) o 0 (no).

Nota

Scegliere un attributo di destinazione solo se si utilizza l'origine dati per l'addestramento e la valutazione di modelli ML.

Per selezionare y come attributo di destinazione

In basso a destra nella tabella, scegliere la freccia singola per passare all'ultima pagina della tabella, dove è visualizzato l'attributo denominato y.
Nella colonna Target (Destinazione), selezionare y.

Amazon ML conferma cheyè selezionato come destinazione.
Scegliere Continue (Continua).
Nella pagina Row ID (ID riga) per Does your data contain an identifier? (I dati contengono un identificatore?), assicurarsi che sia selezionata l'impostazione predefinita No.
Selezionare Review (Rivedi), quindi Continue (Continua).

Ora che si dispone di un'origine dati di addestramento, è possibile creare il proprio modello.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Fase 1: Preparazione dei dati

Fase 3: Creare un modello ML