Diretrizes de conjuntos de dados do Forecast - Amazon Forecast

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Diretrizes de conjuntos de dados do Forecast

Consulte as diretrizes a seguir se o Amazon Forecast não importar o conjunto de dados ou se o conjunto de dados não funcionar conforme esperado.

Formato do time stamp

Para as frequências de coleta Ano (Y), Mês (M), Semana (W) e Dia (D), o Forecast oferece suporte ao formato de carimbo de data e hora yyyy-MM-dd (por exemplo, 2019-08-21) e, opcionalmente, ao formato HH:mm:ss (por exemplo, 2019-08-21 15:00:00).

Para as frequências Hora (H) e Minuto (M), o Forecast oferece suporte somente ao formato yyyy-MM-dd HH:mm:ss (por exemplo, 2019-08-21 15:00:00).

Diretriz: altere o formato de time stamp da frequência da coleta do conjunto de dados para o formato compatível.

Arquivo ou bucket do Amazon S3

Ao importar um conjunto de dados, é possível especificar o caminho para um arquivo CSV ou Parquet no bucket do Amazon Simple Storage Service (Amazon S3) que contém os dados ou o nome do bucket do S3 que contém os dados. Se você especificar um arquivo CSV ou Parquet, o Forecast importará apenas esse arquivo. Se você especificar um bucket do S3, o Forecast importará todos os arquivos CSV ou Parquet no bucket até 10.000 arquivos. Se você importar vários arquivos especificando um nome de bucket, todos os arquivos CSV ou Parquet deverão estar em conformidade com o esquema especificado.

Diretriz: especifique um arquivo ou um bucket do S3 usando a seguinte sintaxe:

s3://bucket-name/example-object.csv

s3://bucket-name/example-object.parquet

s3://bucket-name/prefix/

s3://bucket-name

Os arquivos Parquet podem ter a extensão .parquet, .parq, .pqt ou nenhuma extensão.

Atualizações completas do conjunto de dados

Sua primeira importação de conjunto de dados é sempre uma importação completa. As importações subsequentes podem ser atualizações completas ou incrementais. Você deve usar a API do Forecast para especificar o modo de importação.

Com uma atualização completa, todos os dados existentes são substituídos pelos dados recém-importados. Como os trabalhos de importação de conjunto de dados não são agregados, a importação de conjunto de dados mais recente é usada ao treinar um preditor ou gerar uma previsão.

Diretriz: crie uma atualização incremental de conjunto de dados para anexar seus novos dados aos dados existentes. Diretriz: verifique se a sua importação de conjunto de dados mais recente contém todos os dados que você deseja modelar, e não apenas os novos dados coletados desde a importação anterior.

Atualizações incrementais do conjunto de dados

Campos como carimbo de data/hora, formato de dados, geolocalização etc. são lidos a partir do conjunto de dados atualmente ativo. Você não precisa incluir essas informações em uma importação incremental do conjunto de dados. Se elas forem incluídas, deverão corresponder aos valores fornecidos originalmente.

Diretriz: execute uma importação completa do conjunto de dados para alterar qualquer um desses valores.

Ordem dos atributos

A ordem dos atributos especificados na definição do esquema deve corresponder à ordem das colunas no arquivo CSV ou Parquet que você está importando. Por exemplo, se você definiu timestamp como primeiro atributo, timestamp também deverá ser a primeira coluna no arquivo de entrada.

Diretriz: verifique se as colunas no arquivo de entrada estão na mesma ordem que os atributos de esquema que você criou.

Weather Index

Para aplicar o Weather Index, você deve incluir um atributo de geolocalização na série temporal de destino e em qualquer conjunto de dados de séries temporais relacionadas. Você também precisa especificar fusos horários para os carimbos de data/hora das séries temporais de destino.

Diretriz: certifique-se de que seus conjuntos de dados incluam um atributo de geolocalização e seus carimbos de data/hora tenham um fuso horário atribuído. Para obter mais informações, consulte as Condições e restrições do Weather Index.

Cabeçalho do conjunto de dados

Um cabeçalho do conjunto de dados no arquivo CSV de entrada pode causar um erro de validação. Recomendamos omitir o cabeçalho em arquivos CSV.

Diretriz: exclua o cabeçalho do conjunto de dados e tente importar novamente.

É necessário um cabeçalho de conjunto de dados para arquivos Parquet.

Status do conjunto de dados

Para que você possa importar dados de treinamento na operação CreateDatasetImportJob, o Status do conjunto de dados deve ser ACTIVE.

Diretriz: use a operação DescribeDataset para obter o status do conjunto de dados. Se a criação ou a atualização do conjunto de dados falhar, verifique a formatação do arquivo do conjunto de dados e tente criá-lo novamente.

Formato de arquivo padrão

O formato de arquivo padrão é CSV.

Formato e delimitador de arquivo

O Forecast oferece suporte somente ao formato de arquivo CSV (valores separados por vírgulas) e Parquet. Não é possível separar valores usando tabulações, espaços, dois pontos ou qualquer outro caractere.

Diretriz: converta o conjunto de dados em formato CSV (usando apenas vírgulas como delimitador) ou Parquet e tente importar o arquivo novamente.

Nome do arquivo

Os nomes dos arquivos devem conter pelo menos um caractere alfabético. Arquivos com nomes que são apenas numéricos não podem ser importados.

Diretriz: renomeie o arquivo de dados de entrada para incluir pelo menos um caractere alfabético e tente importar o arquivo novamente.

Dados Parquet particionado

O Forecast não lê arquivos Parquet particionados.

Requisitos de conjunto de dados da análise de hipóteses

As análises de hipóteses exigem conjuntos de dados CSV. A TimeSeriesSelector operação da CreateWhatIfAnalysis ação e a TimeSeriesReplacementDataSource operação do CreateWhatIfForecast não aceitam arquivos Parquet.