Carregamento de dados - Amazon Redshift

Carregamento de dados

Um comando COPY é a forma mais eficiente para carregar uma tabela. Você também pode adicionar dados às suas tabelas usando comandos INSERT, embora isso seja muito menos eficiente que o uso de COPY. O comando COPY é capaz de ler de vários arquivos de dados ou vários fluxos de dados simultaneamente. O Amazon Redshift aloca o workload aos nós do cluster e executa as operações de carregamento em paralelo, incluindo a classificação das linhas e distribuição dos dados entre fatias do nó.

nota

As tabelas externas do Amazon Redshift Spectrum são de somente leitura. Não é possível COPY ou INSERT em uma tabela externa.

Para acessar dados em outros recursos da AWS, seu cluster deve ter permissão para acessar esses recursos e para executar as ações necessárias para acessar os dados. Você pode usar o AWS Identity and Access Management (IAM) para limitar o acesso que os usuários têm aos recursos e dados de seu cluster.

Após o carregamento inicial de seus dados, se você adicionar, modificar ou excluir uma quantia significativa de dados, você deve executar um comando VACUUM para reorganizar seus dados e recuperar espaço após exclusões. Você também deve executar um comando ANALYZE para atualizar as estatísticas da tabela.

Esta seção explica como a carregar dados e solucionar problemas de carregamento de dados, e apresenta as melhores práticas para carregamento de dados.