Permissões obrigatórias para COPY Sintaxe de COPY Parâmetros necessários Parâmetros opcionais Observações sobre uso e recursos adicionais para o comando COPY Exemplos de comando COPY

COPY

A criptografia do lado do cliente para os comandos COPY e UNLOAD não estará mais disponível para novos clientes a partir de 30 de abril de 2025. Se você usou a criptografia do lado do cliente com os comandos COPY e UNLOAD nos 12 meses anteriores a 30 de abril de 2025, poderá continuar usando a criptografia do lado do cliente com os comandos COPY ou UNLOAD até 30 de abril de 2026. Após 30 de abril de 2026, você não poderá usar a criptografia do lado do cliente para COPY e UNLOAD. Recomendamos que você passe a usar a criptografia do lado do servidor para COPY e UNLOAD o mais rápido possível. Se você já usa a criptografia do lado do servidor para COPY e UNLOAD, não há nenhuma alteração a fazer e você pode continuar a usá-la sem alterar suas consultas. Para ter mais informações sobre criptografia para COPY e UNLOAD, consulte o parâmetro ENCRYPTED abaixo.

Carrega dados em uma tabela de arquivos de dados ou de uma tabela do Amazon DynamoDB. Os arquivos podem estar localizados em um bucket do Amazon Simple Storage Service (Amazon S3), em um cluster do Amazon EMR ou em um host remoto acessado com o uso de uma conexão SSH (Secure Shell).

nota

As tabelas externas do Amazon Redshift Spectrum são somente leitura. Não é possível usar o comando COPY em uma tabela externa.

O comando COPY acrescenta os dados de entrada na forma de linhas adicionais na tabela.

O tamanho máximo de uma única linha de entrada de qualquer origem é 4 MB.

Tópicos

Permissões obrigatórias
Sintaxe de COPY
Parâmetros necessários
Parâmetros opcionais
Observações sobre uso e recursos adicionais para o comando COPY
Exemplos de comando COPY
COPY JOB
Referência de parâmetro de COPY
Observações de uso
Exemplos de COPY

Permissões obrigatórias

Para usar o comando COPY, você deve ter o privilégio INSERT para a tabela do Amazon Redshift.

Sintaxe de COPY


COPY table-name 
[ column-list ]
FROM data_source
authorization
[ [ FORMAT ] [ AS ] data_format ] 
[ parameter [ argument ] [, ... ] ]

Você pode realizar uma operação COPY com apenas três parâmetros: um nome de tabela, uma fonte de dados e uma autorização para acessar os dados.

O Amazon Redshift estende a funcionalidade do comando COPY para permitir o carregamento de dados em diversos formatos de dados de várias fontes de dados, o controle de acesso para carregar dados, o gerenciamento de transformações de dados e o gerenciamento da operação de carregamento.

As seções a seguir apresentam os parâmetros do comando COPY obrigatório. agrupando os parâmetros opcionais por função. Elas também descrevem cada parâmetro e explicam como diversas opções funcionam juntas. Você pode ir diretamente à descrição de um parâmetro usando a lista de parâmetros alfabética.

Parâmetros necessários

O comando COPY exige três elementos:

Table Name
Data Source
Authorization

O comando COPY mais simples usa o formato a seguir.


COPY table-name 
FROM data-source
authorization;

O exemplo a seguir criar uma tabela chamada CATDEMO e carrega a tabela com dados de exemplo de um arquivo de dados no Amazon S3 chamado category_pipe.txt.


create table catdemo(catid smallint, catgroup varchar(10), catname varchar(10), catdesc varchar(50));

No exemplo a seguir, a origem dos dados do comando COPY é um arquivo de dados chamado category_pipe.txt na pasta tickit de um bucket do Amazon S3 chamado redshift-downloads. O comando COPY tem autorização para acessar o bucket do Amazon S3 por meio de uma função do AWS Identity and Access Management (IAM). Se o cluster tiver uma função do IAM existente com permissão para acessar o Amazon S3 anexado, você poderá substituir o nome do recurso da Amazon (ARN) no comando COPY a seguir e executá-lo.


copy catdemo
from 's3://redshift-downloads/tickit/category_pipe.txt'
iam_role 'arn:aws:iam::<aws-account-id>:role/<role-name>'
region 'us-east-1';

Para ter instruções completas sobre como usar comandos COPY para carregar dados de exemplo, inclusive instruções para carregar dados de outras regiões da AWS, consulte Carregar dados do Amazon S3 para o Amazon Redshift no Guia de conceitos básicos do Amazon Redshift.

table-name

O nome da tabela de destino do comando COPY. A tabela já deve existir no banco de dados. A tabela pode ser temporária ou persistente. O comando COPY acrescenta os novos dados de entrada a todas as linhas existentes na tabela.

FROM data-source

O local dos dados de origem a serem carregados na tabela de destino. É possível especificar um arquivo de manifesto com algumas fontes de dados.

O repositório de dados mais usado é um bucket do Amazon S3. Você também pode carregar os arquivos de dados localizados em um cluster do Amazon EMR, uma instância do Amazon EC2 ou um host remoto que o cluster pode acessar usando uma conexão SSH, ou ainda pode carregar diretamente de uma tabela do DynamoDB.

Autorização

Uma cláusula que indica o método que o seu cluster usa na autenticação e autorização para acessar outros recursos da AWS. O comando COPY precisa de autorização para acessar dados em outro recurso da AWS, inclusive em Amazon S3, Amazon EMR, Amazon DynamoDB e Amazon EC2. Você pode fornecer essa autorização referenciando uma função do IAM anexada ao cluster ou fornecendo o ID de chave de acesso e a chave de acesso secreta para um usuário do IAM.

Parâmetros opcionais

Opcionalmente, você pode especificar como o COPY mapeia os dados de campo para colunas na tabela de destino, definir atributos de dados de origem para permitir que o comando COPY leia e analise corretamente os dados de origem e gerenciar quais operações o comando COPY executa durante o processo de carregamento.

Opções de mapeamento da coluna
Parâmetros de formato de dados
Parâmetros da conversão de dados
Operações de carregamento de dados

Mapeamento de colunas

Por padrão, COPY insere valores de campo nas colunas da tabela de destino na mesma ordem dos campos ocorridos nos arquivos de dados. Se a ordem de coluna padrão não funcionar, você poderá especificar uma lista de colunas ou usar expressões JSONPath para mapear campos de dados de origem para as colunas de destino.

Parâmetros de formato de dados

Você pode carregar dados de arquivos de texto em formato de largura fixa, delimitado por caractere, CSV (Comma-Separated Values) ou JSON, ou de arquivos Avro.

Por padrão, o comando COPY espera que os dados de origem estejam em arquivos de texto UTF-8 delimitados por caractere. O delimitador padrão é um caractere de barra ( | ). Se os dados de origem estiverem em outro formato, use os parâmetros a seguir para especificar o formato de dados.

Parâmetros da conversão de dados

À medida que carrega a tabela, COPY tenta converter implicitamente as strings nos dados de origem no tipo de dados da coluna de destino. Se precisar especificar uma conversão diferente do comportamento padrão, ou se a conversão padrão resultar em erros, você poderá gerenciar conversões de dados especificando os parâmetros a seguir.

Operações de carregamento de dados

Gerencie o comportamento padrão da operação de carregamento para solucionar problemas ou reduzir o tempo de carregamento especificando os parâmetros a seguir.

Observações sobre uso e recursos adicionais para o comando COPY

Para obter mais informações sobre como usar o comando COPY, consulte os seguintes tópicos:

Exemplos de comando COPY

Para obter mais exemplos que mostram como COPIAR de várias fontes, em formatos diferentes e com diferentes opções de CÓPIA, consulte Exemplos de COPY.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

COMMIT

COPY JOB