Carregamento de dados
Tópicos
- Uso do comando COPY para carregar dados
- Ingestão contínua de arquivos do Amazon S3 (pré-visualização)
- Atualização de tabelas com comandos DML
- Atualização e inserção de novos dados
- Execução de uma cópia profunda
- Análise de tabelas
- Vacuum de tabelas
- Gerenciamento de operações de gravação simultâneas
- Tutorial: Carregar dados do Amazon S3
Um comando COPY é a forma mais eficiente para carregar uma tabela. Você também pode adicionar dados às suas tabelas usando comandos INSERT, embora isso seja muito menos eficiente que o uso de COPY. O comando COPY é capaz de ler de vários arquivos de dados ou vários fluxos de dados simultaneamente. O Amazon Redshift aloca o workload aos nós do cluster e executa as operações de carregamento em paralelo, incluindo a classificação das linhas e distribuição dos dados entre fatias do nó.
nota
As tabelas externas do Amazon Redshift Spectrum são de somente leitura. Não é possível COPY ou INSERT em uma tabela externa.
Para acessar dados em outros recursos da AWS, seu cluster deve ter permissão para acessar esses recursos e para executar as ações necessárias para acessar os dados. Você pode usar o AWS Identity and Access Management (IAM) para limitar o acesso que os usuários têm aos recursos e dados de seu cluster.
Após o carregamento inicial de seus dados, se você adicionar, modificar ou excluir uma quantia significativa de dados, você deve executar um comando VACUUM para reorganizar seus dados e recuperar espaço após exclusões. Você também deve executar um comando ANALYZE para atualizar as estatísticas da tabela.
Esta seção explica como a carregar dados e solucionar problemas de carregamento de dados, e apresenta as melhores práticas para carregamento de dados.