にデータを入力するようにクローラーを設定する AWS Glue Data Catalog - AWS IoT SiteWise

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

にデータを入力するようにクローラーを設定する AWS Glue Data Catalog

AWS Glue クローラはデータストアをクロールして、 にテーブルを入力します AWS Glue Data Catalog。この手順では、エクスポートされたアセットデータを含む S3 バケットの AWS Glue クローラーを作成して実行します。クローラは、アセットプロパティの更新用のテーブルとアセットメタデータ用のテーブルを作成します。その後、Athena を使用してこれらのテーブルに対してSQLクエリを実行できます。詳細については、[AWS Glue Developer Guide] (デベロッパーガイド) の[Populating the AWS Glue Data Catalog] (投入) と[Defining crawlers] (クローラの定義) を参照してください。

AWS Glue クローラーを作成するには
  1. AWS Glue コンソールに移動します。

  2. ナビゲーションペインで、[Crawlers (クローラ) ] を選択します。

  3. [Add crawler (クローラの追加) ] を選択します。

  4. [Add crawler (クローラの追加) ] ページで、次の操作を行います。

    1. クローラの名前 (IoTSiteWiseDataCrawler など) を入力し、[次へ] を選択します。

    2. [クローラソースタイプ] で、[データストア] を選択し、[次へ] を選択します。

    3. [Add a data store page (データストアページの追加) ] で、次の操作を行います。

      1. [Choose a data store (データストアの選択) ] で [S3] を選択します。

      2. [インクルードパス] に、アセットデータバケットをデータストアとして追加するには、s3://amzn-s3-demo-bucket1 を入力します。amzn-s3-demo-bucket1 を、スタックの作成時に選択したバケット名に置き換えます。

      3. [Next (次へ)] を選択します。

        AWS Glue クローラー「データストアの追加」スクリーンショット。
    4. [Add another data store (別のデータストアの追加) ] ページで、[いいえ] を選択し、[次へ] を選択します。

    5. IAM 「ロールの選択」ページで、次の操作を行います。

      1. が S3 バケットにアクセス AWS Glue できるようにする新しいサービスロールを作成するには、IAMロールの作成 を選択します。

      2. ロール名のサフィックス (IoTSiteWiseDataCrawler など) を入力します。

      3. [Next (次へ) ] を選択します。

    6. [頻度] で [毎時] を選択し、[次へ] を選択します。クローラは、実行するたびに新しいデータでテーブルを更新するので、ユースケースに合う任意の頻度を選択できます。

    7. [Configure the crawler's output (クローラの出力を設定する) ] ページで、次の操作を行います。

      1. データベースを追加 を選択して、アセットデータの AWS Glue データベースを作成します。

      2. データベースの名前 (iot_sitewise_asset_database など) を入力します。

      3. [Create] (作成) を選択します。

      4. [Next (次へ) ] を選択します。

    8. クローラの詳細を確認し、[完了] を選択します。

      AWS Glue クローラー「クローラーの詳細を確認する」のスクリーンショット。

デフォルトでは、新しいクローラはすぐには実行されません。手動で実行するか、設定されたスケジュールで実行されるまで待機する必要があります。

クローラを実行するには
  1. [クローラ] ページで、新しいクローラのチェックボックスをオンにし、[Run crawler (クローラの実行) ] を選択します。

    AWS Glue 「クローラーの実行」が強調表示された「クローラー」のスクリーンショット。
  2. クローラが終了し、ステータスが [準備完了] になるまで待ちます。

    クローラの実行には数分かかる場合があり、クローラのステータスは自動的に更新されます。

  3. ナビゲーションペインで、[Table] (テーブル) を選択します。

    asset_metadataasset_property_updates の 2 つの新しいテーブルが表示されます。