Considerações ao usar integrações ETL zero com o Amazon Redshift
As considerações a seguir se aplicam a integrações ETL zero com o Amazon Redshift.
-
O data warehouse de destino do Amazon Redshift deve atender aos seguintes pré-requisitos:
-
Executar o Amazon Redshift sem servidor ou um tipo de nó RA3.
-
Ser criptografado (se estiver usando um cluster provisionado).
-
Ter a diferenciação entre maiúsculas e minúsculas habilitada.
-
-
Se você excluir uma origem de integração autorizada para um data warehouse do Amazon Redshift, todas as integrações associadas entrarão no estado
FAILED
. -
O banco de dados de destino é somente leitura. Não é possível criar tabelas, visualizações ou visões materializadas no banco de dados de destino. No entanto, é possível usar visões materializadas em outras tabelas no data warehouse de destino.
-
As visões materializadas são compatíveis quando usadas em consultas entre bancos de dados. A atualização de visões materializadas com dados replicados de integrações ETL zero leva a uma atualização completa da exibição. Atualização incremental, regravação automática de consultas, atualização automática e visões materializadas automatizadas não são compatíveis. Para obter informações sobre como criar visões materializadas com dados replicados por meio de integrações ETL zero, consulte Consultar dados replicados com visões materializadas.
-
Só é possível consultar tabelas no data warehouse de destino que estejam no estado
Synced
. Para ter mais informações, consulte Métricas para integrações ETL zero. -
Como só aceita caracteres UTF-8, talvez o Amazon Redshift não respeite o agrupamento definido na origem. As regras de classificação e comparação podem ser diferentes, o que pode, em última análise, alterar os resultados da consulta.
-
O tamanho máximo de um tipo de dados VARCHAR do Amazon Redshift é de 65.535 bytes. Quando o conteúdo da fonte não se encaixa nesse limite, a replicação não prossegue e a tabela é colocada em um estado de falha. Para ter mais informações sobre diferenças de tipos de dados entre fontes de integração ETL zero e bancos de dados do Amazon Redshift, consulte Diferenças de tipos de dados entre os bancos de dados Aurora e Amazon Redshift no Guia do usuário do Amazon Aurora.
-
As tabelas na fonte de integração devem ter uma chave primária. Caso contrário, as tabelas não poderão ser replicadas no data warehouse de destino no Amazon Redshift.
Para ter informações sobre como adicionar uma chave primária à edição compatível com o Aurora PostgreSQL, consulte Handle tables without primary keys while creating Amazon Aurora PostgreSQL zero-ETL integrations with Amazon Redshift
no Blog do banco de dados da AWS. Para ter informações sobre como adicionar uma chave primária ao Amazon Aurora MySQL ou ao RDS para MySQL, consulte Handle tables without primary keys while creating Amazon Aurora MySQL or Amazon RDS for MySQL zero-ETL integrations with Amazon Redshift no Blog do banco de dados da AWS. -
É possível usar a filtragem de dados para integrações ETL zero do Aurora para definir o escopo da replicação do banco de dados de origem do cluster de banco de dados de origem do Aurora para o data warehouse de destino do Amazon Redshift. Em vez de replicar todos os dados para o destino, é possível definir um ou mais filtros que incluam ou excluam seletivamente determinadas tabelas da replicação. Consulte mais informações em Filtragem de dados para integrações ETL zero do Aurora com o Amazon Redshift no Guia do usuário do Amazon Aurora.
-
Quanto a Integrações ETL zero do Aurora PostgreSQL com o Amazon Redshift, crie o data warehouse de destino em Visualização prévia. Para ter mais informações, consulte Criar e configurar um data warehouse do Amazon Redshift de destino.
-
A integração ETL zero não permite transformações enquanto replica os dados dos datastores transacionais para o Amazon Redshift. Os dados são replicados no estado em que se encontram com base no banco de dados de origem. No entanto, é possível aplicar transformações nos dados replicados no Amazon Redshift.
-
A integração ETL zero é executada no Amazon Redshift usando conexões paralelas. Ela é executada usando as credenciais do usuário que criou o banco de dados a partir da integração. Quando a consulta é executada, a escalabilidade simultânea não é ativada para essas conexões durante a sincronização (gravações). As leituras de escalabilidade simultânea (de clientes do Amazon Redshift) funcionam para objetos sincronizados.
Para considerações que também se apliquem à origem da integração, consulte um dos seguintes tópicos:
-
Para origens do Aurora, consulte Limitations no Guia de usuário do Amazon Aurora.
-
Para origens do Aurora, consulte Limitations no Guia de usuário do Amazon RDS.