Linee guida sui set di dati per Forecast

Consulta le seguenti linee guida se Amazon Forecast non riesce a importare il set di dati o se il set di dati non funziona come previsto.

Formato timestamp

Per le frequenze di raccolta Year (YM), Month (W), Week (D) e Day (), Forecast supporta il formato yyyy-MM-dd timestamp (ad esempio,2019-08-21) e, facoltativamente, il HH:mm:ss formato (ad esempio,). 2019-08-21 15:00:00

Per le frequenze Hour (H) e Minute (M), Forecast supporta solo il yyyy-MM-dd HH:mm:ss formato (ad esempio2019-08-21 15:00:00).

Linea guida: modificare il formato timestamp per la frequenza di raccolta del set di dati nel formato supportato.

File o bucket Amazon S3

Quando importi un set di dati, puoi specificare il percorso di un file CSV o Parquet nel bucket Amazon Simple Storage Service (Amazon S3) che contiene i tuoi dati o il nome del bucket S3 che contiene i tuoi dati. Se si specifica un file CSV o Parquet, Forecast importa solo quel file. Se specifichi un bucket S3, Forecast importa tutti i file CSV o Parquet nel bucket fino a 10.000 file. Se importate più file specificando il nome di un bucket, tutti i file CSV o Parquet devono essere conformi allo schema specificato.

Linea guida: Specificate un file specifico o un bucket S3 utilizzando la seguente sintassi:

s3://bucket-name/example-object.csv

s3://bucket-name/example-object.parquet

s3://bucket-name/prefix/

s3://bucket-name

I file Parquet possono avere l'estensione .parquet, .parq, .pqt o non avere alcuna estensione.

Aggiornamenti completi dei set di dati

La prima importazione del set di dati è sempre un'importazione completa, le importazioni successive possono essere aggiornamenti completi o incrementali. È necessario utilizzare l'API Forecast per specificare la modalità di importazione.

Con un aggiornamento completo, tutti i dati esistenti vengono sostituiti con i dati appena importati. Poiché i processi di importazione di set di dati completi non vengono aggregati, l'importazione del set di dati più recente è quella utilizzata per addestrare un predittore o generare una previsione.

Linea guida: crea un aggiornamento incrementale del set di dati per aggiungere i nuovi dati ai dati esistenti. Altrimenti, assicurati che l'importazione più recente del set di dati contenga tutti i dati che desideri modellare e non solo i nuovi dati raccolti dopo l'importazione precedente.

Aggiornamenti incrementali dei set di dati

Campi come timestamp, formato dei dati, geolocalizzazione, ecc. vengono letti dal set di dati attualmente attivo. Non è necessario includere queste informazioni con un'importazione incrementale del set di dati. Se sono inclusi, devono corrispondere ai valori originariamente forniti.

Linea guida: esegui un'importazione completa del set di dati per modificare uno di questi valori.

Ordine degli attributi

L'ordine degli attributi specificato nella definizione dello schema deve corrispondere all'ordine delle colonne nel file CSV o Parquet che state importando. Ad esempio, se lo avete definito timestamp come primo attributo, allora timestamp deve essere anche la prima colonna del file di input.

Linea guida: verificate che le colonne del file di input siano nello stesso ordine degli attributi dello schema che avete creato.

Indice meteorologico

Per applicare l'indice meteorologico, è necessario includere un attributo di geolocalizzazione nelle serie temporali di destinazione e in tutti i set di dati relativi alle serie temporali correlate. È inoltre necessario specificare i fusi orari per i timestamp delle serie temporali target.

Linea guida: assicurati che i tuoi set di dati includano un attributo di geolocalizzazione e che ai tuoi timestamp sia assegnato un fuso orario. Per ulteriori informazioni, consulta le condizioni e le restrizioni dell'indice meteorologico.

Intestazione del set di dati

Un'intestazione del set di dati nel file CSV di input può causare un errore di convalida. Ti consigliamo di omettere un'intestazione per i file CSV.

Linee guida: eliminare l'intestazione del set di dati e riprovare l'importazione.

Per i file Parquet è necessaria un'intestazione del set di dati.

Stato del set di dati

Prima di poter importare i dati di addestramento con l'CreateDatasetImportJoboperazione, è necessario che il set Status di dati sia. ACTIVE

Linea guida: utilizzare l'operazione DescribeDataset per ottenere lo stato del set di dati. Se la creazione o l'aggiornamento del set di dati non è riuscito, controllare la formattazione del file del set di dati e provare a crearlo di nuovo.

Formato di file predefinito

Il formato di file predefinito è CSV.

Formato di file e delimitatore

Forecast supporta solo il formato di file con valori separati da virgole (CSV) e il formato Parquet. Non è possibile separare i valori utilizzando tabulazioni, spazi, due punti o qualsiasi altro carattere.

Linea guida: converti il set di dati in formato CSV (usando solo virgole come delimitatore) o in formato Parquet e prova a importare nuovamente il file.

Nome del file

I nomi dei file devono contenere almeno un carattere alfabetico. I file con nomi solo numerici non possono essere importati.

Linea guida: rinomina il file di dati di input per includere almeno un carattere alfabetico e prova a importare nuovamente il file.

Dati partizionati in Parquet

Forecast non legge i file Parquet partizionati.

Requisiti del set di dati di analisi What-If

Le analisi What-If richiedono set di dati CSV. Il TimeSeriesSelector funzionamento dell'CreateWhatIfAnalysisazione e il TimeSeriesReplacementDataSource funzionamento dei file CreateWhatIfForecast non accettano Parquet.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Gestione dei valori mancanti

Predittori di allenamento