Hiperparâmetros do DeepAR - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Hiperparâmetros do DeepAR

Nome do parâmetro Descrição
context_length

O número de momentos que o modelo recebe para observar antes de fazer a previsão. O valor desse parâmetro deve ser o mesmo que o prediction_length. O modelo também recebe entradas atrasadas do destino. Portanto, context_length pode ser bem menor que as sazonalidades típicas. Por exemplo, uma série temporal diária pode ter sazonalidade anual. O modelo inclui automaticamente um atraso de um ano, para que a extensão de contexto possa ser menor que um ano. Os valores de atraso que o modelo seleciona dependem da frequência das séries temporais. Por exemplo, os valores de atraso de uma frequência diária são a semana anterior, 2 semanas, 3 semanas, 4 semanas e ano.

Obrigatório

Valores válidos: inteiro positivo

epochs

O número máximo de passagens nos dados de treinamento. O valor ideal depende do tamanho dos dados e da taxa de aprendizagem. Consulte também early_stopping_patience. Os valores típicos variam de 10 a 1000.

Obrigatório

Valores válidos: inteiro positivo

prediction_length

O número de etapas de tempo que o modelo é treinado para prever, também chamado de horizonte de previsão. O modelo treinado sempre gera previsões com essa extensão. Ele não pode gerar previsões mais extensas. O prediction_length é fixo quando um modelo é treinado e não pode ser alterado posteriormente.

Obrigatório

Valores válidos: inteiro positivo

time_freq

A granularidade da série temporal no conjunto de dados. Use time_freq para selecionar recursos e atrasos apropriados de data. O modelo oferece suporte para as seguintes frequências básicas. Ele também oferece suporte para múltiplos dessas frequências básicas. Por exemplo, 5min especifica uma frequência de 5 minutos.

  • M: mensal

  • W: semanal

  • D: diário

  • H: por hora

  • min: a cada minuto

Obrigatório

Valores válidos: Um número inteiro seguido por M, WDH ou min. Por exemplo, 5min.

cardinality

Ao usar os recursos categóricos (cat), cardinality é uma matriz que especifica o número de categorias (grupos) por recurso categórico. Defina isso como auto para inferir a cardinalidade dos dados. O modo auto também funciona quando nenhum recurso categórico é usado no conjunto de dados. Esta é a configuração recomendada para o parâmetro.

Defina a cardinalidade como ignore para forçar o DeepAR a não usar recursos categóricos, mesmo que eles estejam presentes nos dados.

Para realizar uma validação de dados adicional, é possível definir explicitamente esse parâmetro como o valor real. Por exemplo, se dois recursos categóricos forem fornecidos, em que o primeiro tem 2 e o outro tem 3 valores possíveis, defina isso como [2, 3].

Para obter mais informações sobre como usar o recurso categórico, consulte a seção de dados na página de documentação principal do DeepAR.

Opcional

Valores válidos: auto, ignore, matriz de números inteiros positivos, string vazia ou

Valor padrão: auto

dropout_rate

A taxa de dropout a ser usada durante o treinamento. O modelo usa a regularização de zoneout. Para cada iteração, um subconjunto aleatório de neurônios ocultos não é atualizado. Os valores típicos são inferiores a 0,2.

Opcional

Valores válidos: flutuante

Valor padrão: 0.1

early_stopping_patience

Se esse parâmetro for definido, o treinamento será interrompido quando não houver progresso dentro do número especificado de epochs. O modelo que tiver a menor perda será retornado como o modelo final.

Opcional

Valores válidos: inteiro

embedding_dimension

Tamanho do vetor de incorporação aprendido por recurso categórico (o mesmo valor é usado para todos os recursos categóricos).

O modelo DeepAR pode aprender padrões de séries temporais em nível de grupo quando um recurso de agrupamento categórico é fornecido. Para fazer isso, o modelo aprende um vetor de incorporação de tamanho embedding_dimension para cada grupo, capturando as propriedades em comum de todas as séries temporais do grupo. Se o valor de embedding_dimension for elevado, o modelo capturará padrões mais complexos. No entanto, elevar o embedding_dimension também aumenta o número de parâmetros no modelo, o que torna necessário mais dados de treinamento para que tais parâmetros sejam aprendidos com precisão. Os valores típicos para esse parâmetro estão entre 10 e 100.

Opcional

Valores válidos: inteiro positivo

Valor padrão: 10

learning_rate

A taxa de aprendizagem usada no treinamento. Os valores típicos variam de 1e-4 a 1e-1.

Opcional

Valores válidos: flutuante

Valor padrão: 1e-3

likelihood

O modelo gera uma previsão probabilística e pode fornecer quantis da distribuição e retornar amostras. Dependendo de seus dados, selecione uma probabilidade (modelo de ruído) apropriada que é usada para estimativas de incerteza. As seguintes probabilidades podem ser selecionadas:

  • gaussian: use para dados de valor real.

  • beta: use para destinos de valor real entre 0 e 1, inclusive.

  • negativo-binomial: use para dados de contagem (inteiros não negativos).

  • student-T: uma alternativa para os dados de valor real que funciona bem para dados intermitentes.

  • deterministic-L1: uma função de perda que não estima incerteza e apenas aprende uma previsão de ponto.

Opcional

Valores válidos: gaussian, beta, negative-binomial, student-T ou deterministic-L1.

Valor padrão: student-T

mini_batch_size

O tamanho de minilotes usado durante o treinamento. Os valores típicos variam de 32 a 512.

Opcional

Valores válidos: inteiro positivo

Valor padrão: 128

num_cells

O número de células a ser usado em cada camada oculta da RNN. Os valores típicos variam de 30 a 100.

Opcional

Valores válidos: inteiro positivo

Valor padrão: 40

num_dynamic_feat

O número de dynamic_feat fornecido nos dados. Defina isso como auto para inferir o número de recursos dinâmicos dos dados. O modo auto também funciona quando nenhum recurso dinâmico é usado no conjunto de dados. Esta é a configuração recomendada para o parâmetro.

Para forçar o DeepAR a não usar recursos dinâmicos, mesmo que eles estejam presentes nos dados, defina num_dynamic_feat como ignore.

Para realizar uma validação de dados adicional, é possível definir explicitamente esse parâmetro como o valor inteiro real. Por exemplo, se dois recursos dinâmicos forem fornecidos, defina isso como 2.

Opcional

Valores válidos: auto, ignore, inteiro positivo ou string vazia

Valor padrão: auto

num_eval_samples

O número de amostras que são usadas por série temporal ao calcular métricas de precisão de teste. Esse parâmetro não tem influência no treinamento ou no modelo final. Em particular, o modelo pode ser consultado com um número diferente de amostras. Esse parâmetro afeta apenas as pontuações de precisão relatadas no canal de teste após o treinamento. Valores menores resultam em uma avaliação mais rápida, mas as pontuações de avaliação são tipicamente piores e mais incertas. Ao avaliar com quantis superiores, por exemplo, 0,95, pode ser importante aumentar o número de amostras de avaliação.

Opcional

Valores válidos: inteiro

Valor padrão: 100

num_layers

O número de camadas ocultas na RNN. Os valores típicos variam de 1 a 4.

Opcional

Valores válidos: inteiro positivo

Valor padrão: 2

test_quantiles

Quantis para os quais calcular a perda de quantil no canal de teste.

Opcional

Valores válidos: matriz de flutuantes

Valor padrão: [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]