Data Catalog テーブルの Amazon S3 イベント通知用のクローラーを設定する - AWS Glue

Data Catalog テーブルの Amazon S3 イベント通知用のクローラーを設定する

Data Catalog テーブルがある場合は、AWS Glue コンソールを使用して Amazon S3 イベント通知用のクローラーを設定します。

  1. クローラーのプロパティを設定します。詳細については、「AWS Glue コンソールでのクローラー設定オプションの設定」を参照してください。

  2. [データソースの設定] セクションに、[データは AWS Glue テーブルにマッピング済みですか?] という質問が表示されています。

    [Yes] (はい) を選択して、Data Catalog からの既存のテーブルをデータソースとして選択します。

  3. [Glue tables] (Glue テーブル) セクションで、[Add tables] (テーブルを追加する) を選択します。

    Data source configuration interface with options to select existing Glue tables or add new ones.
  4. [Add table] (テーブルを追加する) モーダルで、データベースとテーブルを設定します。

    • [Network connection] (ネットワーク接続) (オプション): [Add new connection] (新しい接続を追加) を選択します。

    • [Database] (データベース): Data Catalog 内のデータベースを選択します。

    • [Tables] (テーブル): Data Catalog 内のデータベースから 1 つ、または複数のテーブルを選択します。

    • [Subsequent crawler runs] (それ以降のクローラー実行): クローラーに関する Amazon S3 イベント通知を使用するには、[Crawl based on events] (イベントに基づくクロール) を選択します。

    • [Include SQS ARN] (SQS ARN を含める): 有効な SQS ARN を含むデータストアパラメータを指定します。(例えば、arn:aws:sqs:region:account:sqs)

    • [Include dead-letter SQS ARN] (配信不能 SQS ARN を含める) (オプション): 有効な Amazon 配信不能 SQS ARN を指定します。(例えば、arn:aws:sqs:region:account:deadLetterQueue)

    • [確認] を選択します。

    Add Glue tables dialog with network, database, tables, and crawler options.