AWS Glue 接続 - AWS Glue

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Glue 接続

あんAWS Glue接続は、特定のデータストアの接続情報を保存する Data Catalog オブジェクトです。接続には、ログイン認証情報、URI 文字列、Virtual Private Cloud (VPC) 情報などが含まれます。データカタログで接続を作成すると、クローラまたはジョブを作成するたびにすべての接続の詳細を指定する必要がなくなります。接続は、ソースとターゲットの両方に使用できます。

次の接続の種類を使用できます。

  • JDBC

    • Amazon Redshift

    • Amazon Relational Database Service (Amazon RDS)

  • Amazon DocumentDB

  • DynamoDB

  • Kafka

  • Amazon Kinesis

  • MongoDB

  • ネットワーク (Amazon Virtual Private Cloud 環境 (Amazon VPC) 内のデータソースへの接続を指定します。)

  • Amazon S3

とAWSGlue Studio から購入したカスタムコネクタまたはコネクタの接続を作成することもできます。 AWS Marketplace 。詳細については、「」を参照してください。コネクタと接続を使用するAWSGlue スタジオ

これらのデータソースのいずれかに対してクローラまたは抽出、変換、およびロード (ETL) ジョブを作成するときは、使用する接続を指定します。また、開発エンドポイントの作成時またはターゲットへのデータの書き込み時に、接続を指定することもできます。

通常、パブリックインターネット上の Amazon Simple Storage Service (Amazon S3) ソースまたはターゲットに接続する必要はありません。ただし、Virtual Private Cloud (VPC) 内から Amazon S3 にアクセスする場合、ゲートウェイタイプの Amazon S3 VPC エンドポイントが必要です。詳細については、「Amazon S3 の Amazon VPC エンドポイント」を参照してください。

さらに、Virtual Private Cloud (VPC) にある Amazon S3 データソースにアクセスする場合、Networkタイプの接続。

接続情報で、データが VPC を通してアクセスされているかどうかも検討し、それに応じてネットワークパラメータを設定する必要があります。AWS Glueでは、JDBC エンドポイント用のプライベート IP が必要です。データベースへの接続は、VPN および AWS Direct Connect を使用して行うことができます。これは、オンプレミスデータベースにプライベート IP アクセスが付与されるためです。

オンプレミスのデータベースに接続する方法については、」を使用してオンプレミスのデータストアにアクセスして分析する方法AWS GlueでAWSビッグデータブログウェブサイト.