Migre um banco de dados ThoughtSpot Falcon local para o Amazon Redshift - Recomendações da AWS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Migre um banco de dados ThoughtSpot Falcon local para o Amazon Redshift

Criado por Battulga Purevragchaa (AWS) e Antony Prasad Thevaraj (AWS)

Ambiente: PoC ou piloto

Fonte: banco de dados ThoughtSpot Falcon local

Destino: Amazon Redshift

Tipo R: redefinir arquitetura

Workload: todas as outras workloads

Tecnologias: migração; bancos de dados

Serviços da AWS: AWS DMS; Amazon Redshift

Resumo

Os data warehouses on-premises exigem tempo e recursos administrativos significativos, especialmente para grandes conjuntos de dados. O custo financeiro de construir, manter e cultivar esses armazéns também é muito alto. Para ajudar a gerenciar custos, manter baixa a complexidade de extração, transformação e carregamento (ETL) e oferecer desempenho à medida que seus dados crescem, você deve escolher constantemente quais dados carregar e quais arquivar.

Ao migrar seus bancos de dados ThoughtSpot Falcon locais para a nuvem da Amazon Web Services (AWS), você pode acessar data lakes e data warehouses baseados na nuvem que aumentam a agilidade, a segurança e a confiabilidade dos aplicativos de sua empresa, além de reduzir os custos gerais de infraestrutura. O Amazon Redshift ajuda a reduzir significativamente o custo e a sobrecarga operacional de um data warehouse. Você também pode usar o Amazon Redshift Spectrum para analisar grandes quantidades de dados em seu formato nativo sem carregar dados.

Esse padrão descreve as etapas e o processo para migrar um banco de dados ThoughtSpot Falcon de um datacenter local para um banco de dados do Amazon Redshift na nuvem da AWS.

Pré-requisitos e limitações

Pré-requisitos

  • Uma conta AWS ativa

  • Um banco de dados ThoughtSpot Falcon hospedado em um data center local

Versões do produto

  • ThoughtSpot versão 7.0.1 

Arquitetura

Migração de um banco de dados ThoughtSpot Falcon de um datacenter local para o Amazon Redshift.

O diagrama mostra o seguinte fluxo de trabalho:

  1. Os dados são hospedados em um banco de dados relacional on-premises.

  2. O AWS Schema Conversion Tool (AWS SCT) converte a linguagem de definição de dados (DDL) compatível com o Amazon Redshift.

  3. Depois de criar as tabelas, você pode migrar dados usando o AWS Database Migration Service (AWS DMS).

  4. Os dados são carregados no Amazon Redshift.

  5. Os dados são armazenados no Amazon Simple Storage Service (Amazon S3) se você usa Redshift Spectrum ou já hospeda dados no Amazon S3.

Ferramentas

  • AWS DMS: o AWS Data Migration Service (AWS DMS) ajuda você a migrar bancos de dados para a AWS de forma rápida e segura.

  • O Amazon Redshift: o Amazon Redshift é um serviço de data warehouse rápido, totalmente gerenciado e em escala de petabytes que torna simples e econômica a análise eficiente de todos os seus dados usando as ferramentas de business intelligence existentes.

  • AWS SCT: o AWS Schema Conversion Tool (AWS SCT) converte seu esquema de banco de dados existente de um mecanismo de banco de dados para outro.

Épicos

TarefaDescriçãoHabilidades necessárias

Identifique a configuração apropriada do Amazon Redshift.

Identifique a configuração apropriada do cluster do Amazon Redshift com base em seus requisitos e volume de dados. 

Para obter mais informações, consulte Clusters do Amazon Redshift na documentação do Amazon Redshift.

DBA

Pesquisar o Amazon Redshift para avaliar se ele atende aos seus requisitos.

Use as perguntas frequentes do Amazon Redshift para entender e avaliar se o Amazon Redshift atende aos seus requisitos.

DBA
TarefaDescriçãoHabilidades necessárias

Crie um cluster do Amazon Redshift.

Faça login no Console de gerenciamento da AWS, abra o console do Amazon Redshift e crie um cluster do Amazon Redshift em uma nuvem privada virtual (VPC). 

Para obter mais informações, consulte Criar um cluster em uma VPC na documentação do Amazon Redshift.

DBA

Conduzir uma PoC para o design do seu banco de dados do Amazon Redshift.

Siga as práticas recomendadas do Amazon Redshift conduzindo uma prova de conceito (PoC) para o design do seu banco de dados. 

Para obter mais informações, consulte Condução de uma prova de conceito do Amazon Redshift na documentação do Amazon Redshift.

DBA

Criar usuários do banco de dados.

Crie os usuários em seu banco de dados do Amazon Redshift e conceda os perfis apropriados para acesso ao esquema e às tabelas.  

Para obter mais informações, consulte Conceção de privilégios de acesso para um usuário ou grupo de usuários na documentação do Amazon Redshift.

DBA

Aplicar as configurações ao banco de dados de destino.

Aplique configurações ao banco de dados do Amazon Redshift de acordo com seus requisitos. 

Para obter mais informações sobre como habilitar parâmetros em nível de banco de dados, sessão e servidor, consulte a Referência de configuração na documentação do Amazon Redshift.

DBA
TarefaDescriçãoHabilidades necessárias

Crie tabelas manualmente com DDL no Amazon Redshift.

(Opcional) Se você usa o AWS SCT, as tabelas são criadas automaticamente. No entanto, se houver falhas na replicação de DDLs, você precisará criar as tabelas manualmente

DBA

Crie tabelas externas para Redshift Spectrum.

Crie uma tabela externa com um esquema externo para o Amazon Redshift Spectrum. Para criar tabelas externas, você deve ser o proprietário do esquema externo ou um superusuário do banco de dados

Para obter mais informações, consulte Criar tabelas externas para o Amazon Redshift Spectrum na documentação do Amazon Redshift.

DBA
TarefaDescriçãoHabilidades necessárias

Use o AWS DMS para migrar os dados.

Depois de criar o DDL das tabelas no banco de dados do Amazon Redshift, migre seus dados para o Amazon Redshift usando o AWS DMS.

Para obter etapas e instruções detalhadas, consulte Uso de um banco de dados do Amazon Redshift como destino do AWS DMS na documentação do AWS DMS.

DBA

Usar um comando COPY para carregar dados.

Use o comando COPY do Amazon Redshift para carregar dados do Amazon S3 para o Amazon Redshift.

Para obter mais informações, consulte Uso do comando COPY para carregar do Amazon S3 na documentação do Amazon Redshift.

DBA
TarefaDescriçãoHabilidades necessárias

Valide os registros de origem e de destino.

Valide a contagem de tabelas para os registros de origem e destino que foram carregados do seu sistema de origem.

DBA

Implementar as práticas recomendadas do Amazon Redshift para ajuste de desempenho.

Práticas recomendadas do Amazon Redshift para projetar tabelas. 

Para obter mais informações, consulte a publicação As 10 melhores técnicas de ajuste de desempenho do Amazon Redshift no blog.

DBA

Otimize o desempenho da consulta.

O Amazon Redshift usa consultas baseadas em SQL para interagir com dados e objetos no sistema. A linguagem de manipulação de dados (DML) é um subconjunto da SQL que pode ser usado para ver, adicionar, alterar e excluir dados. DDL é um subconjunto de SQL usado para adicionar, alterar excluir objetos do banco de dados, como tabelas e visualizações.

Para obter mais informações, consulte Ajuste do desempenho da consulta na documentação do Amazon Redshift.

DBA

Implementar o WLM.

Você pode usar o gerenciamento de workload (WLM) para definir diversas filas de consultas e rotear consultas para filas apropriadas no runtime.

Para obter mais informações, consulte Implementação do gerenciamento do workload na documentação do Amazon Redshift.

DBA

Trabalhe com escalonamento de simultaneidade.

Ao usar o atributo de escalabilidade de simultaneidade, você pode oferecer suporte a usuários simultâneos e consultas simultâneas praticamente ilimitadas, com desempenho de consulta consistentemente rápido.

Para obter mais informações, consulte Trabalho com escalabilidade simultânea na documentação do Amazon Redshift.

DBA

Use as práticas recomendadas do Amazon Redshift para design de tabelas.

Ao planejar seu banco de dados, certas decisões importantes de design de tabela podem influenciar fortemente o desempenho geral da consulta.

Para obter mais informações sobre como escolher a opções de design de tabelas mais adequada, consulte Práticas recomendadas do Amazon Redshift para projetar tabelas na documentação do Amazon Redshift.

DBA

Crie visões materializadas no Amazon Redshift.

Uma visão materializada contém um conjunto de resultados pré-computados, com base em uma consulta SQL a uma ou mais tabelas base. É possível emitir instruções SELECT para consultar uma visão materializada, da mesma maneira como você pode consultar outras tabelas ou visualizações no banco de dados.

Para obter mais informações, consulte Criar visões materializadas no Amazon Redshift na documentação do Amazon Redshift.

DBA

Definir as junções entre as tabelas.

Para pesquisar mais de uma tabela ao mesmo tempo ThoughtSpot, você deve definir junções entre as tabelas especificando colunas que contêm dados correspondentes em duas tabelas. Essas colunas representam a extremidade primary key da junção foreign key.

Você pode defini-las usando o ALTER TABLE comando no Amazon Redshift ou. ThoughtSpot Para obter mais informações, consulte ALTER TABLE na documentação do Amazon Redshift.

DBA
TarefaDescriçãoHabilidades necessárias

Adicione uma conexão do Amazon Redshift.

Adicione uma conexão do Amazon Redshift ao seu banco de dados Falcon local ThoughtSpot .

Para obter mais informações, consulte Adicionar uma conexão com o Amazon Redshift na ThoughtSpot documentação.

DBA

Editar a conexão do Amazon Redshift.

Você pode editar a conexão do Amazon Redshift para adicionar tabelas e colunas.

Para obter mais informações, consulte Editar uma conexão do Amazon Redshift na ThoughtSpot documentação.

DBA

Remapear a conexão do Amazon Redshift.

Modifique os parâmetros de conexão editando o arquivo .yaml de mapeamento de origem que foi criado quando você adicionou a conexão do Amazon Redshift. 

Por exemplo, você pode remapear a tabela ou coluna existente para uma tabela ou coluna diferente em uma conexão de banco de dados existente. ThoughtSpot recomenda que você verifique as dependências antes e depois de remapear uma tabela ou coluna em uma conexão para garantir que elas sejam exibidas conforme necessário.

Para obter mais informações, consulte Remapear uma conexão do Amazon Redshift na ThoughtSpot documentação.

DBA

Excluir uma tabela da conexão do Amazon Redshift.

(Opcional) Se você tentar remover uma tabela em uma conexão do Amazon Redshift, ThoughtSpot verifica as dependências e mostra uma lista de objetos dependentes. Você pode escolher os objetos listados para excluí-los ou remover a dependência. Em seguida, você pode remover a tabela.

Para obter mais informações, consulte Excluir uma tabela de uma conexão do Amazon Redshift na ThoughtSpot documentação.

DBA

Exclua uma tabela com objetos dependentes de uma conexão do Amazon Redshift.

(Opcional) Se você tentar excluir uma tabela com objetos dependentes, a operação será bloqueada. Uma janela Cannot delete é exibida, com uma lista de links para objetos dependentes. Quando todas as dependências forem removidas, você poderá excluir a tabela

Para obter mais informações, consulte Excluir uma tabela com objetos dependentes de uma conexão do Amazon Redshift na ThoughtSpot documentação.

DBA

Excluir uma conexão do Amazon Redshift.

(Opcional) Como uma conexão pode ser usada em várias fontes de dados ou visualizações, você deve excluir todas as fontes e tarefas que usam essa conexão antes de excluir a conexão do Amazon Redshift.

Para obter mais informações, consulte Excluir uma conexão do Amazon Redshift na ThoughtSpot documentação.

DBA

Verificar a referência de conexão do Amazon Redshift.

Certifique-se de fornecer as informações necessárias para sua conexão com o Amazon Redshift usando a referência de conexão na ThoughtSpot documentação.

DBA

Mais informações