クローラを設定して AWS Glue Data Catalogを入力する - AWS IoT SiteWise

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

クローラを設定して AWS Glue Data Catalogを入力する

AWS Glue クローラーはデータストアをクロールして内のテーブルにデータを入力します。 AWS Glue Data Catalogこの手順では、エクスポートされたアセットデータを含む S3 AWS Glue バケット用のクローラーを作成して実行します。クローラは、アセットプロパティの更新用のテーブルとアセットメタデータ用のテーブルを作成します。次に、Athena を使用してこれらのテーブルに対して SQL クエリを実行できます。詳細については、[AWS Glue Developer Guide] (デベロッパーガイド) の[Populating the AWS Glue Data Catalog] (投入) と[Defining crawlers] (クローラの定義) を参照してください。

クローラーを作成するには AWS Glue
  1. AWS Glue コンソールに移動します。

  2. ナビゲーションペインで、[Crawlers (クローラ) ] を選択します。

  3. [Add crawler (クローラの追加) ] を選択します。

  4. [Add crawler (クローラの追加) ] ページで、次の操作を行います。

    1. クローラの名前 (IoTSiteWiseDataCrawler など) を入力し、[次へ] を選択します。

    2. [クローラソースタイプ] で、[データストア] を選択し、[次へ] を選択します。

    3. [Add a data store page (データストアページの追加) ] で、次の操作を行います。

      1. [Choose a data store (データストアの選択) ] で [S3] を選択します。

      2. [インクルードパス] に、アセットデータバケットをデータストアとして追加するには、s3://DOC-EXAMPLE-BUCKET1 を入力します。DOC-EXAMPLE-BUCKET1 は、スタックの作成時に選択したバケット名に置き換えます。

      3. [Next (次へ) ] を選択します。

        AWS Glue クローラー「データストアを追加」のスクリーンショット。
    4. [Add another data store (別のデータストアの追加) ] ページで、[いいえ] を選択し、[次へ] を選択します。

    5. [Choose an IAM role] (IAM ロールの選択) ページで、次の操作を行います。

      1. S3 AWS Glue バケットへのアクセスを許可する新しいサービスロールを作成するには、[Create an IAM role] を選択します。

      2. ロール名のサフィックス (IoTSiteWiseDataCrawler など) を入力します。

      3. [Next (次へ) ] を選択します。

    6. [頻度] で [毎時] を選択し、[次へ] を選択します。クローラは、実行するたびに新しいデータでテーブルを更新するので、ユースケースに合う任意の頻度を選択できます。

    7. [Configure the crawler's output (クローラの出力を設定する) ] ページで、次の操作を行います。

      1. [Add database] を選択して、 AWS Glue アセットデータ用のデータベースを作成します。

      2. データベースの名前 (iot_sitewise_asset_database など) を入力します。

      3. [Create] (作成) を選択します。

      4. [Next (次へ) ] を選択します。

    8. クローラの詳細を確認し、[完了] を選択します。

      AWS Glue クローラー「クローラーの詳細を確認」のスクリーンショット。

デフォルトでは、新しいクローラはすぐには実行されません。手動で実行するか、設定されたスケジュールで実行されるまで待機する必要があります。

クローラを実行するには
  1. [クローラ] ページで、新しいクローラのチェックボックスをオンにし、[Run crawler (クローラの実行) ] を選択します。

    AWS Glue 「クローラーを実行」が強調表示されている「クローラー」のスクリーンショット。
  2. クローラが終了し、ステータスが [準備完了] になるまで待ちます。

    クローラの実行には数分かかる場合があり、クローラのステータスは自動的に更新されます。

  3. ナビゲーションペインで、[Table] (テーブル) を選択します。

    asset_metadataasset_property_updates の 2 つの新しいテーブルが表示されます。