Carregar dados do Amazon S3
É possível carregar dados do Amazon S3 em uma tabela nova ou existente.
Para carregar dados para uma tabela existente
O editor de consulta v2 utiliza o comando COPY para carregar dados do Amazon S3. O comando COPY gerado e usado no assistente de carregamento de dados do editor de consultas v2 é compatível com muitos parâmetros disponíveis para a sintaxe do comando COPY para copiar do Amazon S3. Para obter informações sobre o comando COPY e suas opções usadas para carregar dados do Amazon S3, consulte COPY do Amazon Simple Storage Service no Guia do desenvolvedor de banco de dados do Amazon Redshift.
Confirme se já foi criada a tabela no banco de dados onde você deseja carregar dados.
Confirme se você está conectado ao banco de dados de destino no painel de visualização em árvore do editor de consultas v2 antes de continuar. É possível criar uma conexão usando o menu de contexto (clique com o botão direito do mouse) para o cluster ou o grupo de trabalho no qual os dados serão carregados.
Selecione
Load data (Carregar dados).
Em Fonte de dados, selecione Carregar de um bucket do S3.
Em S3 URIs (URIs do S3), escolha Browse S3 (Navegar pelo S3) para procurar o bucket do Amazon S3 que contém os dados a serem carregados.
Se o bucket do Amazon S3 especificado não estiver na mesma Região da AWS que a tabela de destino, selecione a S3 file location (Localização do arquivo do S3) para a Região da AWS onde os dados estão localizados.
Selecione This file is a manifest file (Este arquivo é um arquivo manifesto) se o arquivo do Amazon S3 for um manifesto contendo vários URIs de bucket do Amazon S3.
Selecione o File format (Formato do arquivo) para o arquivo a ser carregado. Os formatos de dados compatíveis são CSV, JSON, DELIMITER, FIXEDWIDTH, SHAPEFILE, AVRO, PARQUET e ORC. Dependendo do formato de arquivo especificado, é possível escolher a respectivas File options (Opções de arquivos). Você também pode selecionar Data is encrypted (Os dados são criptografados), se os dados estiverem criptografados, e inserir o nome do recurso da Amazon (ARN) da chave KMS usada para criptografar os dados.
Se você escolher CSV ou DELIMITADOR, também poderá escolher o Caractere delimitador e decidir se deseja Ignorar linhas de cabeçalho se o número especificado de linhas for nomes de colunas em vez de dados a serem carregados.
Escolha um método de compactação para compactar o arquivo. O padrão é sem compactação.
(Opcional) Advanced settings (Configurações avançadas) oferece suporte a vários parâmetros da conversão de dados e operações de carregamento. Insira essas informações conforme necessário para o arquivo.
Para obter mais informações sobre conversão de dados e parâmetros de carregamento de dados, consulte Parâmetros de conversão de dados e Operações de carregamento de dados no Guia do desenvolvedor de banco de dados do Amazon Redshift.
Escolha Próximo.
Escolha Carregar tabela existente.
Confirme ou selecione a localização da Target table (Tabela de destino), incluindo Cluster or workgroup (Cluster ou grupo de trabalho), Database (Banco de dados), Schema (Esquema) e Table (Tabela) em que os dados serão carregados.
Escolha uma função do IAM que tenha as permissões necessários para carregar dados do Amazon S3.
(Opcional) Selecione os nomes das colunas para inseri-las em Column mapping (Mapeamento de colunas) para mapear colunas na ordem do arquivo de dados de entrada.
Selecione Load data (Carregar dados) para iniciar o carregamento de dados.
Quando o carregamento for concluído, exibe-se o editor de consultas o comando COPY gerado que foi usado para carregar seus dados. Exibe-se Result (Resultado) do COPY. Se for concluído corretamente, agora você poderá usar o SQL para selecionar dados da tabela carregada. Quando houver um erro, consulte a visualização do sistema STL_LOAD_ERRORS para obter mais detalhes. Para obter informações sobre erros do comando COPY, consulte STL_LOAD_ERRORS no Guia do desenvolvedor de banco de dados do Amazon Redshift.
Quando você carrega dados em uma nova tabela, o editor de consultas v2 cria a tabela no banco de dados, depois carrega os dados como ações separadas no mesmo fluxo de trabalho.
Como carregar dados em uma nova tabela
O editor de consulta v2 utiliza o comando COPY para carregar dados do Amazon S3. O comando COPY gerado e usado no assistente de carregamento de dados do editor de consultas v2 é compatível com muitos parâmetros disponíveis para a sintaxe do comando COPY para copiar do Amazon S3. Para obter informações sobre o comando COPY e suas opções usadas para carregar dados do Amazon S3, consulte COPY do Amazon Simple Storage Service no Guia do desenvolvedor de banco de dados do Amazon Redshift.
Confirme se você está conectado ao banco de dados de destino no painel de visualização em árvore do editor de consultas v2 antes de continuar. É possível criar uma conexão usando o menu de contexto (clique com o botão direito do mouse) para o cluster ou o grupo de trabalho no qual os dados serão carregados.
Selecione
Load data (Carregar dados).
Em Fonte de dados, selecione Carregar de um bucket do S3.
Em S3 URIs (URIs do S3), escolha Browse S3 (Navegar pelo S3) para procurar o bucket do Amazon S3 que contém os dados a serem carregados.
Se o bucket do Amazon S3 especificado não estiver na mesma Região da AWS que a tabela de destino, selecione a S3 file location (Localização do arquivo do S3) para a Região da AWS onde os dados estão localizados.
Selecione This file is a manifest file (Este arquivo é um arquivo manifesto) se o arquivo do Amazon S3 for um manifesto contendo vários URIs de bucket do Amazon S3.
Selecione o File format (Formato do arquivo) para o arquivo a ser carregado. Os formatos de dados compatíveis são CSV, JSON, DELIMITER, FIXEDWIDTH, SHAPEFILE, AVRO, PARQUET e ORC. Dependendo do formato de arquivo especificado, é possível escolher a respectivas File options (Opções de arquivos). Você também pode selecionar Data is encrypted (Os dados são criptografados), se os dados estiverem criptografados, e inserir o nome do recurso da Amazon (ARN) da chave KMS usada para criptografar os dados.
Se você escolher CSV ou DELIMITADOR, também poderá escolher o Caractere delimitador e decidir se deseja Ignorar linhas de cabeçalho se o número especificado de linhas for nomes de colunas em vez de dados a serem carregados.
Escolha um método de compactação para compactar o arquivo. O padrão é sem compactação.
(Opcional) Advanced settings (Configurações avançadas) oferece suporte a vários parâmetros da conversão de dados e operações de carregamento. Insira essas informações conforme necessário para o arquivo.
Para obter mais informações sobre conversão de dados e parâmetros de carregamento de dados, consulte Parâmetros de conversão de dados e Operações de carregamento de dados no Guia do desenvolvedor de banco de dados do Amazon Redshift.
Escolha Próximo.
Escolha Carregar nova tabela.
As colunas da tabela são inferidas dos dados de entrada. Você pode modificar a definição do esquema da tabela adicionando colunas e detalhes da tabela. Para reverter para o esquema de tabela inferida do editor de consultas v2, escolha Restaurar os padrões.
Confirme ou selecione a localização da Tabela de destino, incluindo o Cluster ou grupo de trabalho, o Banco de dados e o Esquema em que os dados são carregados. Insira um nome para a Tabela que será criada.
Escolha uma função do IAM que tenha as permissões necessários para carregar dados do Amazon S3.
Escolha Criar tabela para criar a tabela usando a definição mostrada.
Um resumo é exibido para revisão da definição da tabela. A tabela é criada no banco de dados. Para excluir a tabela posteriormente, execute um comando SQL DROP TABLE. Para obter mais informações, consulte DROP TABLE no Guia do desenvolvedor de banco de dados do Amazon Redshift.
Selecione Load data (Carregar dados) para iniciar o carregamento de dados.
Quando o carregamento for concluído, exibe-se o editor de consultas o comando COPY gerado que foi usado para carregar seus dados. Exibe-se Result (Resultado) do COPY. Se for concluído corretamente, agora você poderá usar o SQL para selecionar dados da tabela carregada. Quando houver um erro, consulte a visualização do sistema STL_LOAD_ERRORS para obter mais detalhes. Para obter informações sobre erros do comando COPY, consulte STL_LOAD_ERRORS no Guia do desenvolvedor de banco de dados do Amazon Redshift.