Uso de tabelas de séries temporais - Amazon Redshift

Uso de tabelas de séries temporais

Se seus dados têm um período de retenção fixo, você pode organizá-los como uma sequência de tabelas de séries temporais. Nessa sequência, cada tabela é idêntica, mas contém dados para diferentes períodos.

É possível remover dados antigos com facilidade simplesmente executando um comando DROP TABLE nas tabelas correspondentes. Essa abordagem é muito mais rápida do que o processo de executar um comando DELETE em grande escala e evita que você precise executar um processo VACUUM subsequente para recuperar espaço. Para ocultar o fato de que os dados estão armazenados em diferentes tabelas, você pode criar uma exibição UNION ALL. Ao excluir dados antigos, refina a exibição UNION ALL para remover as tabelas descartadas. Da mesma forma, à medida que carrega novos períodos de tempo em novas tabelas, adicione as novas tabelas à exibição. Para orientar o otimizador a ignorar a verificação nas tabelas que não correspondem ao filtro de consulta, sua definição de exibição filtra por intervalo de datas que corresponde a cada tabela.

Evite ter muitas tabelas na exibição UNION ALL. Cada tabela adicional adiciona um curto tempo de processamento à consulta. As tabelas não precisam usar o mesmo período. Por exemplo, você pode ter tabelas para períodos diferentes, como diariamente, mensalmente ou anualmente.

Se você usa tabelas de séries temporais com uma coluna de time stamp para a chave de classificação, você efetivamente carrega seus dados na ordem da chave de classificação. Isso elimina a necessidade de realizar vacuum para reclassificar os dados. Para ter mais informações, consulte Carregamento de dados por ordem de chave de classificação.