オンプレミスの ThoughtSpot Falcon データベースを Amazon Redshift に移行する - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

オンプレミスの ThoughtSpot Falcon データベースを Amazon Redshift に移行する

作成者: Battulga Purevragchaa (AWS) と Antony Prasad Thevaraj (AWS)

環境:PoC またはパイロット

出典: オンプレミスの ThoughtSpot Falcon データベース

ターゲット: Amazon Redshift

R タイプ: リアーキテクト

ワークロード:その他すべてのワークロード

テクノロジー: 移行、データベース

AWS サービス: AWS DMS、Amazon Redshift

[概要]

オンプレミスのデータウェアハウスは、特に大規模なデータセットの場合、管理に多大な時間とリソースを必要とします。これらのウェアハウスの構築、維持、拡張にかかる財務コストも非常に高くなります。コストを管理し、抽出、変換、ロード (ETL) の複雑さを低く抑え、データの増加に応じてパフォーマンスを実現するには、ロードするデータとアーカイブするデータを常に選択する必要があります。

オンプレミスの ThoughtSpot Falcon データベースを Amazon Web Services (AWS) クラウドに移行することで、クラウドベースのデータレイクとデータウェアハウスにアクセスして、インフラストラクチャ全体のコストを削減するだけでなく、ビジネスの俊敏性、セキュリティ、アプリケーションの信頼性を高めることができます。Amazon Redshift は、データウェアハウスのコストと運用上のオーバーヘッドを大幅に削減するのに役立ちます。Amazon Redshift Spectrum を使用して、データをロードせずに大量のデータをネイティブ形式で分析することもできます。

このパターンでは、 ThoughtSpot Falcon データベースをオンプレミスデータセンターからAWSクラウド上の Amazon Redshift データベースに移行する手順とプロセスについて説明します。

前提条件と制限

前提条件

  • アクティブなAWSアカウント

  • オンプレミスデータセンターでホストされている ThoughtSpot Falcon データベース

製品バージョン

  • ThoughtSpot バージョン 7.0.1 

アーキテクチャ

ThoughtSpot Falcon データベースをオンプレミスデータセンターから Amazon Redshift に移行します。

この図表は、次のワークフローを示しています:

  1. データはオンプレミスのリレーショナルデータベースでホストされます。

  2. AWS Schema Conversion Tool (AWS SCT) は、Amazon Redshift と互換性のあるデータ定義言語 (DDL) を変換します。

  3. テーブルを作成したら、AWSDatabase Migration Service (AWS ) を使用してデータを移行できますDMS。

  4. データは Amazon Redshift に読み込まれます。

  5. Redshift Spectrum を使用しているか、既に Amazon S3 でデータをホストしている場合、データは Amazon Simple Storage Service (Amazon S3) に保存されます。

ツール

  • AWS DMS – AWS Data Migration Service (AWS DMS) は、データベースを に迅速かつ安全に移行するのに役立ちますAWS。

  • Amazon Redshift – Amazon Redshift は、高速でフルマネージドのペタバイト規模のデータウェアハウスサービスで、既存のビジネスインテリジェンスツールを使用してすべてのデータを簡単かつコスト効率よく効率的に分析できます。

  • AWS SCT – AWS Schema Conversion Tool (AWS SCT) は、既存のデータベーススキーマをあるデータベースエンジンから別のデータベースエンジンに変換します。

エピック

タスク説明必要なスキル

適切な Amazon Redshift 設定を特定する。

要件とデータ量に基づいて、適切な Amazon Redshift クラスター設定を特定します。 

詳細については、Amazon Redshift ドキュメントの「Amazon Redshift クラスター」を参照してください。

DBA

Amazon Redshift を調べて、要件を満たしているかどうかを評価する。

Amazon Redshift FAQs を使用して、Amazon Redshift が要件を満たしているかどうかを理解し、評価します。

DBA
タスク説明必要なスキル

Amazon Redshift クラスターを作成します。

AWS マネジメントコンソールにサインインし、Amazon Redshift コンソールを開き、仮想プライベートクラウド () に Amazon Redshift クラスターを作成しますVPC。 

詳細については、Amazon Redshift ドキュメントの「 でのクラスターの作成VPC」を参照してください。

DBA

Amazon Redshift データベース設計の PoC を実施する。

Amazon Redshift のベストプラクティスに従い、データベース設計の概念実証 (PoC) を実施します。 

詳細については、Amazon Redshift のドキュメントの Amazon Redshift の概念実証の実施を参照してください。

DBA

データベースユーザーを作成する。

Amazon Redshift データベースにユーザーを作成し、スキーマとテーブルにアクセスするための適切なロールを付与します。 

詳細については、Amazon Redshift のドキュメントの「GRANT」を参照してください。

DBA

ターゲットデータベースに構成設定を適用する。

要件に従って、Amazon Redshift データベースに構成設定を適用します。 

データベース、セッション、およびサーバーレベルのパラメータを有効にする方法の詳細については、Amazon Redshift ドキュメントの「設定リファレンス」を参照してください。

DBA
タスク説明必要なスキル

Amazon Redshift DDLで を使用してテーブルを手動で作成します。

(オプション) を使用するとAWSSCT、テーブルが自動的に作成されます。ただし、 のレプリケート時に障害が発生した場合はDDLs、テーブルを手動で作成する必要があります。

DBA

Redshift Spectrum の外部テーブルを作成する。

Amazon Redshift Spectrum の外部スキーマを使用して外部テーブルを作成します。外部テーブルを作成するには、外部スキーマの所有者またはデータベーススーパーユーザーである必要があります。 

詳細については、Amazon Redshift のドキュメントの「Amazon Redshift Spectrum の外部テーブルの作成」を参照してください。

DBA
タスク説明必要なスキル

AWS DMS を使用してデータを移行します。

Amazon Redshift データベースでテーブルDDLの を作成したら、 を使用してデータを Amazon Redshift AWS に移行しますDMS。

詳細な手順と手順については、AWSDMSAWSドキュメントの「 のターゲットとして Amazon Redshift データベースを使用するDMS」を参照してください。

DBA

COPY コマンドを使用してデータをロードします。

Amazon S3 から Amazon Redshift COPY コマンドを使用して Amazon Redshift にデータをロードします。

詳細については、Amazon Redshift ドキュメントのCOPY「 コマンドを使用して Amazon S3 からロードする」を参照してください。

DBA
タスク説明必要なスキル

ソースレコードとターゲットレコードを検証する。

ソースシステムからロードされたソースレコードとターゲットレコードのテーブル数を検証します。

DBA

Amazon Redshift のパフォーマンスチューニングのベストプラクティスを実装します。

Amazon Redshift テーブル設計のベストプラクティスを実装する。 

詳細については、ブログ記事「Top 10 performance tuning techniques for Amazon Redshift」を参照してください。

DBA

クエリのパフォーマンスを最適化する。

Amazon Redshift は、 SQLベースのクエリを使用して、システム内のデータやオブジェクトとやり取りします。データ操作言語 (DML) SQL は、データの表示、追加、変更、削除に使用できる のサブセットです。DDL は、テーブルやビューなどのデータベースオブジェクトの追加、変更、削除SQLに使用する のサブセットです。

詳細については、Amazon Redshift のドキュメントの「クエリパフォーマンスのチューニング」を参照してください。

DBA

を実装しますWLM。

ワークロード管理 (WLM) を使用して複数のクエリキューを定義し、実行時にクエリを適切なキューにルーティングできます。

詳細については、Amazon Redshift ドキュメントの「ワークロード管理の実装」を参照してください。

DBA

同時実行スケーリングを使用する。

同時実行スケーリング機能を使用すると、実質的に無制限の同時ユーザーと同時クエリをサポートし、一貫して高速なクエリパフォーマンスを実現できます。

詳細については、Amazon Redshift のドキュメントの「同時実行スケーリングを使用する」を参照してください。

DBA

テーブル設計に Amazon Redshift のベストプラクティスを使用する。

データベースをプランニングする際、テーブル設計に関して、全体的なクエリパフォーマンスに多大な影響を与える重要な決定があります。

最適なテーブル設計のオプションを選択する方法については、Amazon Redshift のドキュメントの「Amazon Redshift テーブル設計のベストプラクティス」を参照してください。

DBA

Amazon Redshift でマテリアライズドビューを作成する。

マテリアライズドビューには、1 つ以上のベーステーブルに対するSQLクエリに基づいて計算済みの結果セットが含まれます。SELECT ステートメントを使用すれば、データベースで他のテーブルやビューをクエリするのと同じ方法でマテリアライズドビューをクエリすることができます。

詳細については、Amazon Redshift のドキュメントの「Amazon Redshift でのマテリアライズドビューの作成」を参照してください。

DBA

テーブル間の結合を定義する。

で複数のテーブルを同時に検索するには ThoughtSpot、2 つのテーブル間で一致するデータを含む列を指定して、テーブル間の結合を定義する必要があります。これらの列は、結合の primary key および foreign key を表します。

これらは、Amazon Redshift または の ALTER TABLE コマンドを使用して定義できます ThoughtSpot。詳細については、Amazon Redshift ドキュメントALTERTABLEの「」を参照してください。

DBA
タスク説明必要なスキル

Amazon Redshift 接続を追加する。

オンプレミスの ThoughtSpot Falcon データベースに Amazon Redshift 接続を追加します。

詳細については、 ThoughtSpot ドキュメントの「Amazon Redshift 接続を追加する」を参照してください。

DBA

Amazon Redshift 接続を編集する。

Amazon Redshift 接続を編集してテーブルと列を追加できます。

詳細については、 ThoughtSpot ドキュメントの「Amazon Redshift 接続の編集」を参照してください。

DBA

Amazon Redshift 接続を再マッピングする。

Amazon Redshift 接続を追加したときに作成されたソースマッピングの .yaml ファイルを編集して、接続パラメータを変更します。 

例えば、既存のテーブルまたは列を既存のデータベース接続内の別のテーブルまたは列に再マップできます。 は、接続内のテーブルまたは列を再マップする前と後に依存関係をチェックして、必要に応じて表示されることを確認する ThoughtSpot ことをお勧めします。

詳細については、 ThoughtSpot ドキュメントの「Amazon Redshift 接続のマッピング変更」を参照してください。

DBA

Amazon Redshift 接続からのテーブルを削除する。

(オプション) Amazon Redshift 接続でテーブルを削除しようとすると、 は依存関係 ThoughtSpot をチェックし、依存オブジェクトのリストを表示します。リストされたオブジェクトを選択して削除するか、依存関係を削除できます。その後、テーブルを削除できます。

詳細については、 ThoughtSpot ドキュメントの「Amazon Redshift 接続からテーブルを削除する」を参照してください。

DBA

Amazon Redshift 接続から依存オブジェクトを含むテーブルを削除する。

(オプション) 依存オブジェクトを含むテーブルを削除しようとすると、操作はブロックされます。Cannot delete ウィンドウが開き、依存オブジェクトへのリンクのリストが表示されます。依存関係がすべて削除されると、テーブルを削除できます。

詳細については、 ThoughtSpot ドキュメントの「Amazon Redshift 接続から依存オブジェクトを含むテーブルを削除する」を参照してください。

DBA

Amazon Redshift 接続を削除する。

(オプション) 接続は複数のデータソースまたはビジュアライゼーションで使用できるので、Amazon Redshift 接続を削除する前に、その接続を使用するすべてのソースとタスクを削除する必要があります。

詳細については、 ThoughtSpot ドキュメントの「Amazon Redshift 接続の削除」を参照してください。

DBA

Amazon Redshift の接続に関するリファレンスを確認する。

ThoughtSpot ドキュメントの接続リファレンスを使用して、Amazon Redshift 接続に必要な情報を提供してください。

DBA

追加情報