Esegui la migrazione di un database ThoughtSpot Falcon locale su Amazon Redshift - Prontuario AWS

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Esegui la migrazione di un database ThoughtSpot Falcon locale su Amazon Redshift

Creato da Battulga Purevragchaa (AWS) e Antony Prasad Thevaraj (AWS)

Ambiente: PoC o pilota

Fonte: database Falcon locale ThoughtSpot

Obiettivo: Amazon Redshift

Tipo R: Re-architect

Carico di lavoro: tutti gli altri carichi di lavoro

Tecnologie: migrazione; database

Servizi AWS: AWS DMS; Amazon Redshift

Riepilogo

I data warehouse locali richiedono tempi e risorse di amministrazione significativi, in particolare per set di dati di grandi dimensioni. Anche il costo finanziario della costruzione, della manutenzione e della crescita di questi magazzini è molto elevato. Per aiutare a gestire i costi, mantenere bassa la complessità di estrazione, trasformazione e caricamento (ETL) e fornire prestazioni man mano che i dati crescono, è necessario scegliere costantemente quali dati caricare e quali archiviare.

Migrando i database ThoughtSpot Falcon locali sul cloud Amazon Web Services (AWS), puoi accedere a data lake e data warehouse basati sul cloud che aumentano l'agilità aziendale, la sicurezza e l'affidabilità delle applicazioni, oltre a ridurre i costi complessivi dell'infrastruttura. Amazon Redshift aiuta a ridurre in modo significativo i costi e le spese operative di un data warehouse. Puoi anche utilizzare Amazon Redshift Spectrum per analizzare grandi quantità di dati nel suo formato nativo senza caricarli.

Questo modello descrive i passaggi e il processo per la migrazione di un database ThoughtSpot Falcon da un data center locale a un database Amazon Redshift sul cloud AWS.

Prerequisiti e limitazioni

Prerequisiti

  • Un account AWS attivo

  • Un database ThoughtSpot Falcon ospitato in un data center locale

Versioni del prodotto

  • ThoughtSpot versione 7.0.1 

Architettura

Migrazione di un database ThoughtSpot Falcon da un data center locale ad Amazon Redshift.

Il diagramma mostra il flusso di lavoro seguente:

  1. I dati sono ospitati in un database relazionale locale.

  2. AWS Schema Conversion Tool (AWS SCT) converte il linguaggio di definizione dei dati (DDL) compatibile con Amazon Redshift.

  3. Dopo aver creato le tabelle, puoi migrare i dati utilizzando AWS Database Migration Service (AWS DMS).

  4. I dati vengono caricati in Amazon Redshift.

  5. I dati vengono archiviati in Amazon Simple Storage Service (Amazon S3) se utilizzi Redshift Spectrum o se hai già ospitato i dati in Amazon S3.

Strumenti

  • AWS DMS: AWS Data Migration Service (AWS DMS) ti aiuta a migrare i database in modo rapido e sicuro su AWS.

  • Amazon Redshift — Amazon Redshift è un servizio di data warehouse veloce, completamente gestito e su scala petabyte che semplifica ed economica l'analisi efficiente di tutti i dati utilizzando gli strumenti di business intelligence esistenti.

  • AWS SCT — AWS Schema Conversion Tool (AWS SCT) converte lo schema di database esistente da un motore di database a un altro.

Epiche

AttivitàDescrizioneCompetenze richieste

Identifica la configurazione Amazon Redshift appropriata.

Identifica la configurazione del cluster Amazon Redshift appropriata in base ai tuoi requisiti e al volume di dati. 

Per ulteriori informazioni, consulta i cluster Amazon Redshift nella documentazione di Amazon Redshift.

DBA

Cerca Amazon Redshift per valutare se soddisfa i tuoi requisiti.

Utilizza le domande frequenti su Amazon Redshift per capire e valutare se Amazon Redshift soddisfa i tuoi requisiti.

DBA
AttivitàDescrizioneCompetenze richieste

Crea un cluster Amazon Redshift.

Accedi alla Console di gestione AWS, apri la console Amazon Redshift e crea un cluster Amazon Redshift in un cloud privato virtuale (VPC). 

Per ulteriori informazioni, consulta Creazione di un cluster in un VPC nella documentazione di Amazon Redshift.

DBA

Esegui un PoC per la progettazione del tuo database Amazon Redshift.

Segui le best practice di Amazon Redshift eseguendo un proof of concept (PoC) per la progettazione del tuo database. 

Per ulteriori informazioni, consulta Condurre un proof of concept per Amazon Redshift nella documentazione di Amazon Redshift.

DBA

Crea utenti del database.

Crea gli utenti nel tuo database Amazon Redshift e concedi i ruoli appropriati per l'accesso allo schema e alle tabelle.  

Per ulteriori informazioni, consulta Concedere i privilegi di accesso per un utente o un gruppo di utenti nella documentazione di Amazon Redshift.

DBA

Applica le impostazioni di configurazione al database di destinazione.

Applica le impostazioni di configurazione al database Amazon Redshift in base ai tuoi requisiti. 

Per ulteriori informazioni sull'abilitazione dei parametri a livello di database, sessione e server, consulta il riferimento alla configurazione nella documentazione di Amazon Redshift.

DBA
AttivitàDescrizioneCompetenze richieste

Crea manualmente tabelle con DDL in Amazon Redshift.

(Facoltativo) Se utilizzi AWS SCT, le tabelle vengono create automaticamente. Tuttavia, se si verificano errori durante la replica delle DDL, è necessario creare manualmente le tabelle

DBA

Crea tabelle esterne per Redshift Spectrum.

Crea una tabella esterna con uno schema esterno per Amazon Redshift Spectrum. Per creare tabelle esterne, devi essere il proprietario dello schema esterno o un superutente del database

Per ulteriori informazioni, consulta Creazione di tabelle esterne per Amazon Redshift Spectrum nella documentazione di Amazon Redshift.

DBA
AttivitàDescrizioneCompetenze richieste

Usa AWS DMS per migrare i dati.

Dopo aver creato il DDL delle tabelle nel database Amazon Redshift, migra i dati su Amazon Redshift utilizzando AWS DMS.

Per passaggi e istruzioni dettagliate, consulta Usare un database Amazon Redshift come destinazione per AWS DMS nella documentazione di AWS DMS.

DBA

Utilizzate il comando COPY per caricare i dati.

Usa il COPY comando Amazon Redshift per caricare i dati da Amazon S3 ad Amazon Redshift.

Per ulteriori informazioni, consulta Utilizzo del comando COPY per il caricamento da Amazon S3 nella documentazione di Amazon Redshift.

DBA
AttivitàDescrizioneCompetenze richieste

Convalida i record di origine e di destinazione.

Convalida il conteggio delle tabelle per i record di origine e di destinazione che sono stati caricati dal sistema di origine.

DBA

Implementa le best practice di Amazon Redshift per l'ottimizzazione delle prestazioni.

Implementa le best practice di Amazon Redshift per la progettazione di tabelle e database. 

Per ulteriori informazioni, consulta il post sul blog Le 10 migliori tecniche di ottimizzazione delle prestazioni per Amazon Redshift.

DBA

Ottimizza le prestazioni delle query.

Amazon Redshift utilizza query basate su SQL per interagire con dati e oggetti nel sistema. Il linguaggio di manipolazione dei dati (DML) è il sottoinsieme di SQL che puoi utilizzare per visualizzare, aggiungere, modificare ed eliminare dati. DDL è il sottoinsieme di SQL utilizzato per aggiungere, modificare ed eliminare oggetti di database come tabelle e viste.

Per ulteriori informazioni, consulta Tuning query performance nella documentazione di Amazon Redshift.

DBA

Implementa WLM.

È possibile utilizzare la gestione del carico di lavoro (WLM) per definire più code di interrogazioni e indirizzare le query alle code appropriate in fase di esecuzione.

Per ulteriori informazioni, consulta Implementazione della gestione del carico di lavoro nella documentazione di Amazon Redshift.

DBA

Lavora con il ridimensionamento simultaneo.

Utilizzando la funzionalità Concurrency Scaling, è possibile supportare un numero virtualmente illimitato di utenti e query simultanee, con prestazioni di query costantemente elevate.

Per ulteriori informazioni, consulta Working with concurrency scaling nella documentazione di Amazon Redshift.

DBA

Utilizza le best practice di Amazon Redshift per la progettazione di tabelle.

Quando pianifichi il tuo database, alcune importanti decisioni sulla progettazione delle tabelle possono influenzare fortemente le prestazioni complessive delle query.

Per ulteriori informazioni sulla scelta dell'opzione di progettazione delle tabelle più appropriata, consulta le best practice di Amazon Redshift per la progettazione di tabelle nella documentazione di Amazon Redshift.

DBA

Crea viste materializzate in Amazon Redshift.

Una vista materializzata contiene un set di risultati precalcolato basato su una query SQL su una o più tabelle di base. È possibile emettere SELECT istruzioni per interrogare una vista materializzata nello stesso modo in cui si esegue una query su altre tabelle o viste del database.

Per ulteriori informazioni, consulta Creazione di viste materializzate in Amazon Redshift nella documentazione di Amazon Redshift.

DBA

Definire le giunzioni tra le tabelle.

Per cercare più di una tabella contemporaneamente ThoughtSpot, è necessario definire i join tra le tabelle specificando le colonne che contengono i dati corrispondenti su due tabelle. Queste colonne rappresentano la fine primary key foreign key del join.

Puoi definirli utilizzando il ALTER TABLE comando in Amazon Redshift o. ThoughtSpot Per ulteriori informazioni, consulta ALTER TABLE nella documentazione di Amazon Redshift.

DBA
AttivitàDescrizioneCompetenze richieste

Aggiungi una connessione Amazon Redshift.

Aggiungi una connessione Amazon Redshift al tuo database Falcon locale ThoughtSpot .

Per ulteriori informazioni, consulta Aggiungere una connessione Amazon Redshift nella ThoughtSpot documentazione.

DBA

Modifica la connessione Amazon Redshift.

Puoi modificare la connessione Amazon Redshift per aggiungere tabelle e colonne.

Per ulteriori informazioni, consulta Modificare una connessione Amazon Redshift nella ThoughtSpot documentazione.

DBA

Rimappa la connessione Amazon Redshift.

Modifica i parametri di connessione modificando il file di mappatura dei sorgenti .yaml creato quando hai aggiunto la connessione Amazon Redshift. 

Ad esempio, puoi rimappare la tabella o la colonna esistente su una tabella o colonna diversa in una connessione al database esistente. ThoughtSpot consiglia di controllare le dipendenze prima e dopo aver rimappato una tabella o una colonna in una connessione per assicurarsi che vengano visualizzate come richiesto.

Per ulteriori informazioni, consulta Rimappare una connessione Amazon Redshift nella ThoughtSpot documentazione.

DBA

Elimina una tabella dalla connessione Amazon Redshift.

(Facoltativo) Se tenti di rimuovere una tabella in una connessione Amazon Redshift, ThoughtSpot verifica le dipendenze e mostra un elenco di oggetti dipendenti. Puoi scegliere gli oggetti elencati per eliminarli o rimuovere la dipendenza. È quindi possibile rimuovere la tabella.

Per ulteriori informazioni, consulta Eliminare una tabella da una connessione Amazon Redshift nella ThoughtSpot documentazione.

DBA

Elimina una tabella con oggetti dipendenti da una connessione Amazon Redshift.

(Facoltativo) Se tenti di eliminare una tabella con oggetti dipendenti, l'operazione viene bloccata. Viene visualizzata una Cannot delete finestra con un elenco di collegamenti agli oggetti dipendenti. Una volta rimosse tutte le dipendenze, è possibile eliminare la tabella

Per ulteriori informazioni, consulta Eliminare una tabella con oggetti dipendenti da una connessione Amazon Redshift nella ThoughtSpot documentazione.

DBA

Elimina una connessione Amazon Redshift.

(Facoltativo) Poiché una connessione può essere utilizzata in più fonti di dati o visualizzazioni, è necessario eliminare tutte le fonti e le attività che utilizzano tale connessione prima di poter eliminare la connessione Amazon Redshift.

Per ulteriori informazioni, consulta Eliminare una connessione Amazon Redshift nella ThoughtSpot documentazione.

DBA

Controlla il riferimento di connessione per Amazon Redshift.

Assicurati di fornire le informazioni richieste per la tua connessione Amazon Redshift utilizzando il riferimento Connection nella ThoughtSpot documentazione.

DBA

Informazioni aggiuntive