AWS SCT のソースとしての Amazon Redshift の使用 - AWS Schema Conversion Tool

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS SCT のソースとしての Amazon Redshift の使用

Amazon Redshift クラスターを最適化するには、AWS SCT を使用することができます。AWS SCTに、Amazon Redshift クラスターのディストリビューションキーとソートキーの選択に関する推奨事項が記載されています。Amazon Redshift 最適化プロジェクトは、ソースとターゲットが異なる Amazon Redshift クラスターを指す AWS SCT プロジェクトと見なすことができます。

ソースデータベースとしての Amazon Redshift の権限

Amazon Redshift をソースとして使用するには、次の権限が必要です。

  • USAGE ON SCHEMA <schema_name>

  • SELECT ON ALL TABLES IN SCHEMA <schema_name>

  • SELECT ON PG_CATALOG.PG_STATISTIC

  • SELECT ON SVV_TABLE_INFO

  • SELECT ON TABLE STV_BLOCKLIST

  • SELECT ON TABLE STV_TBL_PERM

  • SELECT ON SYS_SERVERLESS_USAGE

  • SELECT ON PG_DATABASE_INFO

  • SELECT ON PG_STATISTIC

前述の例では、<schema_name> プレースホルダーをソースデータベースの名前に置き換えます。

ターゲットとしての Amazon Redshift に必要な権限については、「ターゲットとしての Amazon Redshift の許可」をご参照ください。

ソースとしての Amazon Redshift への接続

以下の手順を使用して、Amazon Redshift ソースデータベースを AWS Schema Conversion Tool に接続します。

Amazon Redshift ソースデータベースへの接続
  1. AWS Schema Conversion Tool で、[Add source] (ソースの追加) を選択します。

  2. [Amazon Redshift] を選択し、次に [Next] (次へ) を選択します。

    [Add source] (ソースの追加) ダイアログボックスが表示されます。

  3. [接続名] にデータベースの名前を入力します。この名前が AWS SCT の左側のパネルのツリーに表示されます。

  4. AWS Secrets Manager からのデータベース認証情報を使用するか、手動で入力してください。

    • Secrets Manager のデータベース認証情報を使用するには、以下の手順に従ってください。

      1. [AWS シークレット] で、シークレットの名前を選択します。

      2. [入力] を選択すると、Secrets Manager のデータベース接続ダイアログボックスにすべての値が自動的に入力されます。

      Secrets Manager のデータベース認証情報を使用する方法については、「AWS Secrets Manager を使用する」を参照してください。

    • Amazon Redshift ソースデータベースの接続情報を入力するには、以下の手順に従います。

      パラメータ アクション
      [Server name] (サーバー名)

      ソースデータベースサーバーのドメインネームシステム (DNS) 名または IP アドレスを入力します。

      Server port

      ソースデータベースサーバーへの接続に使用するポートを入力します。

      データベース

      Amazon Redshift データベースの名前を入力します。

      User name (ユーザー名) と [Password] (パスワード)

      データベース認証情報を入力して、ソースデータベースサーバーに接続します。

      AWS SCT でパスワードを使用して、プロジェクト内のデータベースに接続することを選択する場合にのみソースデータベースに接続します。ソースデータベースのパスワードの漏洩を防ぐため、デフォルトで AWS SCT にパスワードは保存されません。AWS SCT プロジェクトを閉じて再び開いた場合は、必要に応じて、ソースデータベースへの接続に使用するパスワードの入力を求められます。

      SSL の使用

      データベースへの接続に Secure Sockets Layer (SSL) を使用する場合は、このオプションを選択します。[SSL] タブで、必要に応じて、以下の追加情報を提供します。

      • [サーバー認証情報を確認する]: 信頼ストアを使用してサーバー証明書を確認するには、このオプションを選択します。

      • [信頼ストア]: 証明書を保存している信頼ストアの場所。この場所を [グローバル設定] に追加すると、ここに表示されます。

      Amazon Redshift の SSL サポートの詳細については、「接続のセキュリティオプションを設定する」を参照してください。

      Store Password

      AWS SCT は、安全なボールトを作成して、SSL 証明書とデータベースパスワードを保存します。このオプションをオンにすると、データベースのパスワードが保存されるため、パスワードを入力しなくてもデータベースにすばやく接続できます。

      [Redshift ドライバーパス]

      ソースデータベースへの接続に使用するドライバのパスを入力します。詳細については、「必要なデータベースドライバーのダウンロード」を参照してください。

      ドライバパスをグローバルプロジェクト設定に保存する場合、ドライバパスは接続ダイアログボックスに表示されません。詳細については、「グローバル設定でのドライバパスの保存」を参照してください。

  5. [Test Connection] (接続のテスト) を選択して、AWS SCT がソースデータベースに正常に接続できることを確認します。

  6. [Connect] (接続) を選択して、ソースデータベースに接続します。

Amazon Redshift 最適化設定

Amazon Redshift 最適化設定を編集するには、[設定] を選択しAWS SCT、[コンバージョン設定] を選択します。上のリストから [Amazon Redshift] を選択し、次に [Amazon Redshift — Amazon Redshift] を選択します。AWS SCT に、Amazon Redshift の最適化に使用可能なすべての設定が表示されます。

AWS SCT の Amazon Redshift 最適化設定には、以下のオプションが含まれます。

  • 変換されたコード内のアクション項目に関するコメントの数を制限する。

    [変換後のコードにコメントを追加] で、選択した重要度以上のアクションアイテムについて、アクションアイテムの重要度を選択します。AWS SCT は、選択した重要度以上のアクションアイテムについて、変換後のコードにコメントを追加します。

    例えば、変換済みのコード内のコメント数を最小限に抑えるには、[エラーのみ] を選択します。変換済みのコードにすべてのアクション項目のコメントを含めるには、[すべてのメッセージ] を選択します。

  • AWS SCT でターゲット Amazon Redshift クラスターに適用できるテーブルの最大数を設定します。

    [ターゲット Amazon Redshift クラスターの最大テーブル数] では、AWS SCT が Amazon Redshift クラスターに適用できるテーブルの数を選択します。

    Amazon Redshift には、クラスターノードタイプの使用を制限するクォータがあります。[自動] を選択した場合、AWS SCT はノードタイプに応じてターゲット Amazon Redshift クラスターに適用するテーブルの数を決定します。オプションで、値を手動で選択します。詳細については、「Amazon Redshift 管理ガイド」の「Amazon Redshift のクォータと制限」を参照してください。

    テーブルの数が Amazon Redshift クラスターに保存できる数を超えている場合でも、AWS SCT はすべてのソーステーブルを変換します。AWS SCT では、変換されたコードはプロジェクトに保存され、ターゲットデータベースには適用されません。変換したコードを適用したときにテーブルの Amazon Redshift クラスターのクォータに達すると、AWS SCT に警告メッセージが表示されます。また、テーブルの数が制限に達するまで、AWS SCT はターゲット Amazon Redshift クラスターにテーブルを適用します。

  • 移行戦略を選択するには。

    AWS では、最適化プロジェクトのソースとターゲットとして異なるクラスターを使用することを推奨しています。Amazon Redshift 最適化プロセスを開始する前に、ソース Amazon Redshift クラスターのコピーを作成します。このコピーにソースデータを含めることも、空のクラスターを作成することもできます。

    [移行戦略] では、[コピーに移行] を選択して、ソースクラスターのデータをターゲットクラスターに含めます。

    [移行戦略] では、[クリーンな状態に移行する] を選択し、最適化の提案を確認します。これらの提案を受け入れたら、ソースデータをターゲットクラスターに移行します。

  • Amazon Redshift テーブルの列に圧縮を適用します。そのためには、[圧縮エンコードを使用] を選択します。

    AWS SCT は、デフォルトの Amazon Redshift アルゴリズムを使用して、圧縮エンコーディングを列に自動的に割り当てます。詳細については、『Amazon Redshift データベースデベロッパーガイド』の「圧縮エンコード」を参照してください。

    デフォルトでは、Amazon Redshift はソートキーと分散キーとして定義されている列に圧縮を適用しません。この動作を変更したり、これらの列に圧縮を適用したりできます。そのためには、[KEY 列には圧縮エンコードを使用] を選択します。このオプションは、[圧縮エンコードを使用] オプションを選択した場合にのみ選択できます。

  • 自動テーブル最適化を使用するには。

    自動テーブル最適化は、テーブルの設計を自動的に最適化する Amazon Redshift の自己調整プロセスです。詳細については、『Amazon Redshift データベース開発者ガイド』の「自動テーブル最適化の操作」を参照してください。

    自動テーブル最適化にのみ使用するには、左側のペインで [最適化戦略] を選択します。次に [Amazon Redshift 自動テーブルチューニングを使用する] を選択し、[初期キー選択戦略] で [なし] を選択します。

  • 戦略を使用してソートキーと分散キーを選択するには。

    Amazon Redshift メタデータ、統計情報、またはこれらのオプションの両方を使用して、ソートキーと配布キーを選択できます。[最適化戦略] タブの [初期キー選択戦略] では、以下のいずれかのオプションを選択します。

    • メタデータを使用し、統計情報は無視する

    • メタデータを無視し、統計情報を使用する

    • メタデータと統計情報を使用する

    選択したオプションに応じて、最適化戦略を選択できます。次に、各戦略について、値 (0~100) を入力します。これらの値は各戦略の重みを定義します。これらの重み値を使用して、AWS SCTは各ルールがディストリビューションキーとソートキーの選択にどのように影響するかを定義します。デフォルト値は、AWS 移行のベストプラクティスに基づいています。

    [小さいテーブルを検索] 戦略の小さいテーブルのサイズを定義できます。[最小テーブル行数] と [最大テーブル行数] には、テーブル内の最小行数と最大行数を入力して小さいテーブルとして定義します。AWS SCT は ALL 分散スタイルを小さなテーブルに適用します。この場合は、テーブル全体のコピーがすべてのノードに分散されます。

  • 戦略の詳細を設定するには。

    各最適化戦略の重みを定義することに加えて、最適化設定を構成できます。そのためには、[変換の最適化] を選択します。

    • [ソートキー列の制限] には、ソートキーの列の最大数を入力します。

    • [歪んだしきい値] には、列の歪んだ値のパーセンテージ (0 ~ 100) を入力します。AWS SCT は、歪み値がしきい値より大きい列を分散キーの候補リストから除外します。AWS SCT では、列の歪んだ値をレコードの総数に対する最も一般的な値の出現回数の割合として定義します。

    • [クエリ履歴テーブルの上位 N 件のクエリ] には、分析対象として最も頻繁に使用されるクエリの数 (1 ~ 100) を入力します。

    • [統計ユーザーを選択] では、クエリ統計を分析するデータベースユーザーを選択します。