Iperparametri DeepAR

La tabella seguente elenca gli iperparametri che puoi impostare durante l'allenamento con l'algoritmo di previsione Amazon SageMaker AI DeepAR.

Nome parametro	Descrizione
`context_length`	Il numero di punti temporali ottenuti dal modello prima di effettuare la previsione. Il valore di questo parametro deve essere più o meno lo stesso di `prediction_length`. Il modello, inoltre, riceve input ritardati dalla destinazione, perciò `context_length` può essere molto inferiore rispetto alle stagionalità tipiche. Ad esempio, una serie temporale giornaliera può avere una stagionalità annuale. Il modello include automaticamente un ritardo di un anno, pertanto la lunghezza del contesto può essere inferiore a un anno. I valori di ritardo che il modello preleva dipendono dalla frequenza della serie temporale. Ad esempio, i valori di ritardo per la frequenza giornaliera sono settimana precedente, 2 settimane, 3 settimane, 4 settimane e anno. Campo obbligatorio Valori validi: numeri interi positivi
`epochs`	Numero massimo di passate sui dati di addestramento. Il valore ottimale dipende dalle dimensioni dei dati e dalla velocità di apprendimento. Consulta anche `early_stopping_patience`. I valori tipici sono compresi tra 10 e 1000. Campo obbligatorio Valori validi: numeri interi positivi
`prediction_length`	Numero di fasi temporali che il modello è in grado di prevedere, noto anche come orizzonte di previsione. Il modello addestrato genera sempre previsioni con questa durata. Non è in grado di generare previsioni più lunghe. Il valore `prediction_length` viene fissato quando un modello viene addestrato e non può essere modificato in un secondo momento. Campo obbligatorio Valori validi: numeri interi positivi
`time_freq`	Granularità della serie temporale nel set di dati. Utilizza `time_freq` per selezionare i ritardi e le funzionalità relative alla data. Il modello supporta solo le seguenti frequenze di base. Inoltre, supporta più frequenze di base. Ad esempio, `5min` specifica una frequenza di 5 minuti. M: mensilmente W: settimanalmente D: giornalmente H: orario min: ogni minuto Campo obbligatorio I valori validi: un numero intero seguito da M, W, D, H o min. Ad esempio, `5min`.
`cardinality`	Quando utilizzi la caratteristiche di categoria (`cat`), `cardinality` è una matrice che specifica il numero di categorie (gruppi) per ogni caratteristica di categoria. Imposta il valore su `auto` per dedurre la cardinalità dai dati. La modalità `auto` funziona anche quando nel set di dati non vengono utilizzate caratteristiche di categoria. Questa è l'impostazione consigliata per il parametro. Imposta la cardinalità su `ignore` per forzare DeepAR a non utilizzare le caratteristiche di categoria, anche se presenti nei dati. Per eseguire ulteriori convalide dei dati, è possibile impostare esplicitamente questo parametro sul valore effettivo. Ad esempio, se vengono fornite due caratteristiche di categoria in cui la prima ha 2 e l'altra ha 3 valori possibili, imposta il parametro su [2, 3]. Per ulteriori informazioni su come utilizzare la caratteristica di categoria, consulta la sezione dei dati nella pagina della documentazione principale di DeepAR. Opzionale I valori validi: `auto`, `ignore`, array di interi positivi, stringa vuota oppure Valore predefinito: `auto`
`dropout_rate`	Tasso di abbandono da utilizzare durante l’addestramento. Il modello utilizza la regolarizzazione del metodo zoneout. Per ogni iterazione un sottoinsieme casuale di neuroni nascosti non viene aggiornato. I valori tipici sono inferiori a 0,2. Opzionale Valori validi: float. Valore predefinito: 0,1
`early_stopping_patience`	Se questo parametro è impostato, l’addestramento si interrompe quando non si registrano progressi entro il numero specificato di `epochs`. Il modello con la perdita più bassa viene restituito come modello finale. Opzionale Valori validi: numero intero
`embedding_dimension`	La dimensione del vettore di incorporamento appreso per caratteristica di categoria (lo stesso valore è utilizzato per tutte le caratteristiche di categoria). Il modello DeepAR può apprendere modelli di serie temporali a livello di gruppo quando viene fornita una caratteristica di raggruppamento categorica. Per eseguire questa operazione, il modello apprende un vettore di incorporamento di dimensioni `embedding_dimension` per ciascun gruppo e acquisisce le proprietà comuni a tutte le serie temporali del gruppo. Un valore `embedding_dimension` più grande consente al modello di acquisire modelli più complessi. Tuttavia, perché l'aumento di `embedding_dimension` aumenti il numero di parametri nel modello, sono necessari più dati di addestramento per apprendere correttamente questi parametri. I valori tipici di questo parametro sono compresi tra 10 e 100. Opzionale Valori validi: numeri interi positivi Valore predefinito: 10
`learning_rate`	Velocità di apprendimento utilizzata durante l’addestramento. I valori tipici sono compresi tra 1e-4 e 1e-1. Opzionale Valori validi: float. Valore predefinito: 1e-3
`likelihood`	Il modello genera una previsione probabilistica e può fornire quantili della distribuzione e restituire campioni. A seconda dei tuoi dati, seleziona una probabilità appropriata (modello di disturbo) utilizzata per le stime di incertezza. È possibile selezionare le probabilità seguenti: gaussian (gaussiano): si utilizza per i dati più importanti. beta: si utilizza per i target a valori reali compresi tra 0 e 1 inclusi. negative-binomial (binomial negativo): si utilizza per i dati di conteggio (numeri interi non negativi). student-T (T studente): un'alternativa per i dati a valore reale ideali per i dati con lunghi intervalli di inattività. deterministic-L1 (L1 deterministico): una funzione di perdita che non valuta l'incertezza e apprende unicamente una previsione di punti. Opzionale Valori validi: uno tra gaussian (gaussiano), beta, negative-binomial (binomial negativo), student-T (T studente) e deterministic-L1 (L1 deterministico). Valore predefinito: `student-T`
`mini_batch_size`	Dimensione dei mini batch usati durante l’addestramento. I valori tipici sono compresi tra 32 e 512. Opzionale Valori validi: numeri interi positivi Valore predefinito: 128
`num_cells`	Numero di celle da utilizzare in ciascun livello nascosto delle reti neurali ricorrenti (RNN). I valori tipici sono compresi tra 30 e 100. Opzionale Valori validi: numeri interi positivi Valore predefinito: 40
`num_dynamic_feat`	Il numero di `dynamic_feat` forniti nei dati. Imposta il valore su `auto` per dedurre il numero di caratteristiche dinamiche dai dati. La modalità `auto` funziona anche quando nel set di dati non vengono utilizzate caratteristiche dinamiche. Questa è l'impostazione consigliata per il parametro. Per forzare DeepAR a non utilizzare le caratteristiche dinamiche, anche se presenti nei dati, imposta `num_dynamic_feat` su `ignore`. Per eseguire ulteriori convalide dei dati, è possibile impostare esplicitamente questo parametro sul numero intero effettivo. Ad esempio, se vengono fornite due caratteristiche dinamiche, imposta questo valore su 2. Opzionale I valori validi: `auto`, `ignore`, numero intero positivo o stringa vuota Valore predefinito: `auto`
`num_eval_samples`	Il numero di esempi utilizzati per ogni serie temporale quando si calcolano i parametri di accuratezza del test. Questo parametro non ha alcuna influenza sull’addestramento o sul modello finale. In particolare, è possibile eseguire le query sul modello con un numero di esempi diverso. Questo parametro influisce solo sui punteggi di accuratezza riportati nel canale di test dopo l’addestramento. I valori più piccoli producono una valutazione più rapidamente, ma i punteggi di valutazione sono in genere peggiori e meno accurati. Quando si valuta con quantili più elevati, ad esempio 0,95, può essere importante aumentare il numero di esempi di valutazione. Opzionale Valori validi: numero intero Valore predefinito: 100
`num_layers`	Numero di livelli nascosti nelle reti neurali ricorrenti (RNN). I valori tipici sono compresi tra 1 e 4. Opzionale Valori validi: numeri interi positivi Valore predefinito: 2
`test_quantiles`	Quantili per i quali calcolare lo scarto quantile sul canale di test. Opzionale Valori validi: array di float Valore predefinito: [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Come funziona DeepAR

Ottimizzazione del modello