AWS Glue Data Catalog での接続の定義 - AWS Glue

AWS Glue Data Catalog での接続の定義

AWS Glue 接続は、特定のデータストアのログイン認証情報、URI 文字列、仮想プライベートクラウド (VPC) 情報などを保存するデータカタログオブジェクトです。AWS Glue クローラー、ジョブ、および開発エンドポイントは、特定のタイプのデータストアにアクセスするために接続を使用します。ソースとターゲットの両方に接続を使用したり、複数のクローラーまたは抽出、変換、ロード (ETL) ジョブで同じ接続を再利用したりできます。

AWS Glue では次の接続タイプをサポートしています。

  • JDBC

  • Amazon Relational Database Service (Amazon RDS)

  • Amazon Redshift

  • Amazon DocumentDB

  • Kafka

  • MongoDB

  • Network (Amazon Virtual Private Cloud (Amazon VPC) 内のデータソースへの接続を指定します)

AWS Glue Studio を使用して、コネクタの接続を作成することもできます。コネクタとは、AWS Glue Studio 内でデータストアに対するアクセスを支援するための、オプションのコードパッケージです。詳細については、「Using connectors and connections with AWS Glue Studio」を参照してください。

オンプレミスのデータベースに接続する方法の詳細については、AWS ビッグデータブログ記事「AWS Glue を使用することによってオンプレミスデータストアにアクセスして分析する方法」を参照してください。