Conceitos básicos das integrações ETL zero do Amazon RDS com o Amazon Redshift - Amazon Relational Database Service

Conceitos básicos das integrações ETL zero do Amazon RDS com o Amazon Redshift

Esta é a documentação de pré-lançamento das Integrações ETL zero do Amazon RDS com o Amazon Redshift, que está em versão de pré-visualização. A documentação e o atributo estão sujeitos a alterações. Recomendamos o uso desse atributo somente em ambientes de teste, e não em ambientes de produção. Para conferir os termos e condições da pré-visualização, consulte Betas e pré-visualizações nos Termos de serviços da AWS.

Antes de criar uma integração ETL zero com o Amazon Redshift, configure o banco de dados do RDS e o data warehouse do Amazon Redshift com os parâmetros e as permissões necessários. Durante a configuração, você realizará as seguintes etapas:

Depois de concluir essas tarefas, prossiga para Criar integrações ETL zero do Amazon Aurora com o Amazon Redshift.

Etapa 1: Criar um grupo de parâmetros de de banco de dados personalizado

As integrações ETL zero do Amazon RDS com o Amazon Redshift exigem valores específicos para os parâmetros do banco de dados que controlam o registro em log binário (binlog). Para configurar o registro em log binário, primeiro é necessário criar um grupo de parâmetros de cluster de banco de dados personalizado e, depois, associá-lo ao banco de dados de origem.

Crie um grupo de parâmetros de de banco de dados personalizado com as seguintes configurações, . Para obter instruções de como criar um grupo de parâmetros, consulte Grupos de parâmetros de banco de dados para instâncias de banco de dados do Amazon RDS.

  • binlog_format=ROW

  • binlog_row_image=full

  • binlog_checksum=NONE

Além disso, verifique se o parâmetro binlog_row_value_options não está definido como PARTIAL_JSON.

Etapa 2: Selecionar ou criar um banco de dados de origem

Depois de criar um grupo de parâmetros de de banco de dados personalizado, selecione ou crie uma instância de banco de dados de uma única zona de disponibilidade ou multi-AZ do RDS para MySQL. Esse banco de dados será a origem da replicação de dados para o Amazon Redshift.

O banco de dados deve estar executando o RDS para MySQL versão 8.0.32 ou posterior. Consulte instruções para criar uma instância de banco de dados de uma única zona de disponibilidade ou multi-AZ, consulte Criar uma instância de banco de dados do Amazon RDS.

Em Configuração adicional, altere o grupo de parâmetros de de banco de dados padrão para o grupo de parâmetros personalizado que você criou na etapa anterior.

nota

se você associar o grupo de parâmetros ao banco de dados depois que o banco de dados for criado, você deverá reinicializar o banco de dados para aplicar as alterações antes de criar uma Integração ETL zero. Para obter instruções, consulte Reinicializar uma instância de banco de dados .

Além disso, certifique-se de que os backups automatizados estejam habilitados no banco de dados. Para ter mais informações, consulte Ativar backups automáticos.

Etapa 3: Criar um data warehouse de destino do Amazon Redshift

Depois de criar o banco de dados, será necessário criar e configurar um data warehouse de destino no Amazon Redshift. O data warehouse deve cumprir os seguintes requisitos:

  • Criado na pré-visualização

    • Para criar um cluster provisionado em versão prévia, escolha Criar cluster de versão prévia no banner do painel de clusters provisionados. Para obter mais informações, consulte Criar um cluster de versão prévia.

      Um banner na parte superior do painel de clusters provisionados no Redshift. O botão Criar cluster de visualização prévia é destacado.

      Ao criar o cluster, defina a faixa de versão prévia como preview_2023.

    • Para criar um grupo de trabalho de tecnologia sem servidor do Redshift na versão prévia, escolha Criar grupo de trabalho de versão prévia no banner do painel Tecnologia sem servidor. Para obter mais informações, consulte Criar um grupo de trabalho de versão prévia.

      Um banner na parte superior do Painel da tecnologia sem servidor no Redshift. O botão Criar visualização prévia de grupo de trabalho é destacado.
  • Usar um tipo de nó RA3 (ra3.xlplus, ra3.4xlarge ou ra3.16xlarge) com pelo menos dois nós ou o Redshift sem servidor.

  • Ser criptografado (se estiver usando um cluster provisionado). Para obter mais informações, consulte Criptografia de bancos de dados no Amazon Redshift.

Para obter instruções sobre como criar um data warehouse, consulte Criar um cluster para clusters provisionados ou Criar um grupo de trabalho com um namespace para o Redshift Serverless.

Ative a distinção entre maiúsculas e minúsculas no data warehouse

Para que a integração seja bem-sucedida, o parâmetro de diferenciação de maiúsculas e minúsculas (enable_case_sensitive_identifier) deve estar ativado para o data warehouse. Por padrão, a distinção entre maiúsculas e minúsculas é desativada em todos os clusters provisionados e grupos de trabalho do Redshift Serverless.

Para ativar a distinção entre maiúsculas e minúsculas, execute as seguintes etapas, dependendo do tipo de data warehouse:

  • Cluster provisionado: para ativar a distinção entre maiúsculas e minúsculas em um cluster provisionado, crie um grupo de parâmetros personalizado com o parâmetro enable_case_sensitive_identifier ativado. Em seguida, associe o grupo de parâmetros ao cluster. Para obter instruções, consulte Gerenciar grupos de parâmetros usando o console ou Configurar valores de parâmetros usando a AWS CLI.

    nota

    Lembre-se de reinicializar o cluster depois de associar o grupo de parâmetros personalizado a ele.

  • Grupo de trabalho de tecnologia sem servidor: para ativar a distinção entre maiúsculas e minúsculas em um grupo de trabalho do Redshift Serverless, você deve usar a AWS CLI. Atualmente, o console do Amazon Redshift não é compatível com a modificação dos valores dos parâmetros do Redshift Serverless. Envie a seguinte solicitação de atualização do grupo de trabalho:

    aws redshift-serverless update-workgroup \ --workgroup-name target-workgroup \ --config-parameters parameterKey=enable_case_sensitive_identifier,parameterValue=true

    Não é necessário reinicializar um grupo de trabalho após modificar seus valores de parâmetros.

Configurar a autorização para o data warehouse

Depois de criar um data warehouse, você deve configurar o banco de dados do RDS de origem como uma origem de integração autorizada. Para obter instruções, consulte Configurar a autorização para o data warehouse do Amazon Redshift.

Próximas etapas

Com um banco de dados do RDS de origem e um data warehouse de destino do Amazon Redshift, agora você pode criar uma Integração ETL zero e começar a replicar dados. Para obter instruções, consulte Criar integrações ETL zero do Amazon Aurora com o Amazon Redshift.