AWS Glue 接続プロパティ - AWS Glue

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Glue 接続プロパティ

AWS Glue コンソールで設定を定義する場合は、次のプロパティに値を指定する必要があります。

接続名

接続の一意の名前を入力します。

接続タイプ

JDBC またはいずれかの接続タイプを選択します。

JDBC 接続タイプの詳細については、「AWS Glue JDBC 接続プロパティ」を参照してください。

選択ネットワークAmazon Virtual Private Cloud 環境 (Amazon VPC) 内のデータソースに接続する。

選択したタイプに応じて、AWS Glue コンソールにその他の必須フィールドが表示されます。たとえば、[] を選択するとAmazon RDSの場合は、データベースエンジンを選択する必要があります。

要求される SSL 接続

このオプションを選択すると、AWS Glueデータストアへの接続が、信頼できる Secure Sockets Layer (SSL) 経由で接続されていることを確認します。

このオプションを選択したときに利用できる追加オプションなどの詳細については、「AWS Glue 接続 SSL のプロパティ」を参照してください。

MSK クラスターを選択 (Amazon が管理するストリーミング Apache カフカ (MSK) のみ)

別の MSK クラスターを指定します。AWSアカウント.

カフカのブートストラップサーバーURL(カフカのみ)

ブートストラップサーバ URL のカンマ区切りリストを指定します。ポート番号を入力します。例:b-1.vpc-test-2.o4q88o.c6.kafka.us-east-1.amazonaws.com: 9094、b-2.vpc-test-2.o4q88o.c6.kafka.us-east-1.amazonaws.com: 9094、b-3.vpc-test-2.o4q88o4q88o.c6.k88o.c6q88o.c6.ka.us-east-east-east-east-1.amazon.c

AWS Glue JDBC 接続プロパティ

AWS Glue は、JDBC 接続を介して次のデータストアに接続できます。

  • Amazon Redshift

  • Amazon Aurora

  • Microsoft SQL Server

  • MySQL

  • Oracle

  • PostgreSQL

重要

現在、ETL ジョブは 1 つのサブネット内でのみの JDBC 接続を使用します。1 つのジョブに複数のデータストアがある場合は、同じサブネットにある必要があります。

JDBC 接続タイプの追加プロパティを次に示します。

JDBC URL

JDBC データストアの URL を入力します。ほとんどのデータベースエンジンの場合、このフィールドは次の形式になります。この形式では、protocolhostport、および db_name を独自の情報に置き換えます。

jdbc:protocol://host:port/db_name

データベースエンジンに応じて、別の JDBC URL の形式が必要な場合があります。この形式では、コロン (:) とスラッシュ (/) の使用方法が若干異なるか、データベースを指定するためのキーワードが異なる場合があります。

JDBC をデータストアに接続するためには、データストアの db_name が必要です。db_name は、指定された usernamepassword を使用してネットワーク接続を確立するために使用されます。接続すると、AWS Glue はデータストア内の他のデータベースにアクセスして、クローラを実行したり ETL ジョブを実行したりできます。

次の JDBC URL の例は、いくつかのデータベースエンジンの構文を示しています。

  • Amazon Redshift クラスターデータストアに接続するにはdevデータベース:

    jdbc:redshift://xxx.us-east-1.redshift.amazonaws.com:8192/dev

  • Amazon RDS for MySQL データストアに接続するにはemployeeデータベース:

    jdbc:mysql://xxx-cluster.cluster-xxx.us-east-1.rds.amazonaws.com:3306/employee

  • Amazon RDS for PostgreSQL データストアに接続する。employeeデータベース:

    jdbc:postgresql://xxx-cluster.cluster-xxx.us-east-1.rds.amazonaws.com:5432/employee

  • Amazon RDS for Oracle データストアに接続するにはemployeeサービス名:

    jdbc:oracle:thin://@xxx-cluster.cluster-xxx.us-east-1.rds.amazonaws.com:1521/employee

    Amazon RDS for Oracle の構文は次のパターンに従います。これらのパターンでは、hostportservice_nameSID を独自の情報に置き換えます。

    • jdbc:oracle:thin://@host:port/service_name

    • jdbc:oracle:thin://@host:port:SID

  • Amazon RDS for Microsoft SQL Server データストアに接続する。employeeデータベース:

    jdbc:sqlserver://xxx-cluster.cluster-xxx.us-east-1.rds.amazonaws.com:1433;databaseName=employee

    Amazon RDS for SQL Server の構文は次のパターンに従います。これらのパターンでは、server_nameport、および db_name を独自の情報に置き換えます。

    • jdbc:sqlserver://server_name:port;database=db_name

    • jdbc:sqlserver://server_name:port;databaseName=db_name

  • に接続するにはAmazon Aurora PostgreSQLインスタンスのemployeeデータベースで、データベースインスタンスのエンドポイント、ポート、データベース名を指定します。

    jdbc:postgresql://employee_instance_1.xxxxxxxxxxxx.us-east-2.rds.amazonaws.com:5432/employee

Username

JDBC データストアにアクセスする権限を持つユーザー名を指定します。

パスワード

JDBC データストアへのアクセス権を持つユーザー名のパスワードを入力します。

ポート

Amazon RDS Oracle インスタンスに接続する JDBC URL で使用するポートを入力します。このフィールドは、要求される SSL 接続Amazon RDS Oracle インスタンスとして選択されています。

VPC

データストアを含む仮想プライベートクラウド (VPC) の名前を選択します。AWS Glue コンソールには、現在のリージョンの VPC がすべて表示されます。

サブネット

データストアを含む VPC 内のサブネットを選択します。AWS Glue コンソールには VPC 内のデータストアのすべてのサブネットが一覧表示されます。

セキュリティグループ

データストアに関連付けられているセキュリティグループを選択します。AWS Glue には、AWS Glue の接続を許可するインバウンドソースルールを持つ 1 つ以上のセキュリティグループが必要です。AWS Glue​ コンソールには、VPC へのインバウンドアクセスが許可されているすべてのセキュリティグループが一覧表示されます。AWS Glue は、VPC サブネットにアタッチされている Elastic Network Interface にこれらのセキュリティグループを関連付けます。

AWS Glue 接続 SSL のプロパティ

以下は、要求される SSL 接続の プロパティAWS Glue接続。

このオプションを選択しない場合、AWS Glueデータストアへの接続の暗号化に SSL を使用するときに、はエラーを無視します。設定の手順については、データストアのマニュアルを参照してください。このオプションを選択すると、AWS Glue​ が SSL を使用して接続できない場合、開発エンドポイントでジョブの実行、クローラ、または ETL は失敗します。

このオプションは、AWS Glueクライアント側。JDBC 接続の場合、AWS Glue証明書とホスト名の検証を使用する SSL 経由でのみ接続します。SSL 接続サポートは、次の場合に利用できます。

  • Oracle Database

  • Microsoft SQL Server

  • PostgreSQL

  • Amazon Redshift

  • MySQL (Amazon RDS インスタンスのみ)

  • Amazon Aurora MySQL (Amazon RDS インスタンスのみ)

  • Amazon Aurora PostgreSQL(Amazon RDS インスタンスのみ)

  • カフカ、含まれていますAmazon Managed Streaming for Apache Kafka

注記

を有効にするにはAmazon RDS Oracle使用するデータストア要求される SSL 接続を選択した場合は、Oracle インスタンスへのオプショングループを作成してアタッチする必要があります。

  1. にサインインします。AWS Management ConsoleAmazon RDS コンソール () を開きます。https://console.aws.amazon.com/rds/

  2. の追加オプショングループAmazon RDS Oracle インスタンスに接続する。Amazon RDS コンソールで、オプショングループを追加する方法についての詳細は、「」を参照してください。オプショングループを作成する

  3. の追加オプションオプショングループにSSL。-ポートSSL に指定した値は、後でAWS GlueAmazon RDS Oracle インスタンスの JDBC 接続 URL。Amazon RDS コンソールで、オプションを追加する方法についての詳細は、「」を参照してください。オプショングループにオプションを追加する()Amazon RDS ユーザーガイド。Oracle SSL オプションの詳細については、Oracle SSL()Amazon RDS ユーザーガイド

  4. リポジトリの []AWS Glueコンソールで、Amazon RDS Oracle インスタンスへの接続を作成します。接続定義で、[Require SSL connection] を選択します。要求されたら、ポートを Amazon RDS Oracle SSL オプションで使用していることを確認します。

次の追加のオプションプロパティは、要求される SSL 接続が接続用に選択されます。

S3 のカスタム JDBC 証明書

オンプレミスまたはクラウドデータベースとの SSL 通信に現在使用している証明書がある場合は、この証明書を AWS Glue データソースまたはターゲットへの SSL 接続に使用できます。カスタムルート証明書が含まれている Amazon Simple Storage Service (Amazon S3) の場所を入力します。AWS Glueデータベースへの SSL 接続を確立するために、はこの証明書を使用します。AWS GlueX.509 証明書のみを処理します。証明書は DER エンコードし、Base64 エンコード PEM 形式で指定する必要があります。

このフィールドを空白のままにすると、デフォルトの証明書が使用されます。

カスタム JDBC 証明書文字列

JDBC データベースに固有の証明書情報を入力します。これは、ドメインの一致または識別名 (DN) の一致に使用される文字列です。Oracle Database の場合、この文字列は tnsnames.ora ファイルの security セクションの SSL_SERVER_CERT_DN パラメータにマッピングされます。Microsoft SQL Server の場合、この文字列は hostNameInCertificate として使用されます。

Oracle Database の SSL_SERVER_CERT_DN パラメータの例を次に示します。

cn=sales,cn=OracleContext,dc=us,dc=example,dc=com
カフカのプライベート CA 証明書の場所

Kafka データストアとの SSL 通信に現在使用している証明書がある場合は、この証明書をAWS Glue接続。このオプションは Kafka データストアに必須で、Amazon Managed Streaming for Apache Kafkaデータストア。カスタムルート証明書が含まれている Amazon Simple Storage Service (Amazon S3) の場所を入力します。AWS Glueはこの証明書を使用して Kafka データストアへの SSL 接続を確立します。AWS GlueX.509 証明書のみを処理します。証明書は DER エンコードし、Base64 エンコード PEM 形式で指定する必要があります。

証明書の検証をスキップ

[証明書の検証をスキップ] チェックボックスをオンにして、AWS Glue によるカスタム証明書の検証をスキップします。検証することを選択すると、AWS Glue は証明書の署名アルゴリズムとサブジェクトパブリックキーアルゴリズムを検証します。証明書の検証に失敗すると、この接続を使用する ETL ジョブまたはクローラはすべて失敗します。

許可される署名アルゴリズムは、SHA256withRSA、SHA384withRSA、または SHA512withRSA のみです。サブジェクトパブリックキーアルゴリズムの場合、キーの長さは 2048 以上にする必要があります。

カフカクライアントのキーストアの場所

Kafka クライアント側認証用のクライアントキーストアファイルの Amazon S3 の場所。パスは s3: //bucket/接頭辞/ファイル名.jks の形式でなければなりません。ファイル名および.jks 拡張子で終わる必要があります。

Kafka クライアントキーストアのパスワード (オプション)

指定されたキーストアにアクセスするためのパスワード。

Kafka クライアントキーパスワード (オプション)

キーストアは、複数のキーで構成することができるので、これは、Kafkaサーバー側のキーで使用されるクライアントキーにアクセスするためのパスワードです。