ファイル形式 - AWS IoT Analytics

と同様の機能については AWS IoT Analytics、Amazon Kinesis 、Amazon S3、Amazon Athena をご覧ください。これらのサービスは、進化する分析要件を満たすためのスケーラビリティと柔軟性を高めます。ここでは、 https://aws-blogs-prod.amazon.com/iot/unlocking-scalable-iot-analytics-on-aws/について説明します。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ファイル形式

AWS IoT Analytics データストアでは現在、JSON と Parquet のファイル形式がサポートされています。デフォルトのファイル形式は JSON です。

  • JSON (JavaScript Object Notation)-名前と値のペアと順序付けられた値リストをサポートするテキスト形式。

  • Apache Parquet - 大量のデータを効率的に格納およびクエリするために使用する列指向ストレージ形式。

AWS IoT Analytics データストアのファイル形式を設定するために、データストアの作成時に FileFormatConfiguration オブジェクトを使用できます。

fileFormatConfiguration

ファイル形式の設定情報が含まれます。AWS IoT Analytics データストアでは、JSON と Parquet がサポートされています。

デフォルトのファイル形式は JSON です。指定できるフォーマットは 1 つだけです。データストアを作成した後は、ファイル形式を変更することはできません。

jsonConfiguration

JSON 形式の構成情報が含まれます。

parquetConfiguration

Parquet 形式の構成情報が含まれます。

schemaDefinition

スキーマを定義するために必要な情報。

columns

データを保存する 1 つまたは複数の列を指定します。

各スキーマには、最大 100 個の列を設定できます。各列には、最大 100 個のネストされたタイプを含めることができます

name

列の名前。

長さの制約: 1~255 文字。

type

データのタイプ。サポートされているデータ型の詳細については、AWS Glue デベロッパーガイドの「共通のデータ型」を参照してください。

長さの制約: 1~131072 文字。

AWS IoT Analytics では、Amazon Athena のデータ型ページに記載されているすべてのデータ型 (DECIMAL(precision, scale) - precision を除く) がサポートされています。

データストアを作成する (コンソール)

次の手順は、データが Parquet 形式で保存されるデータストアを作成する方法です。

データストアを作成する方法
  1. https://console.aws.amazon.com/iotanalytics/ にサインインします。

  2. ナビゲーションペインで、[Data stores] (データストア) を選択します。

  3. [Data stores] (データストア) ページで、[Create data store] (データストアの作成) を選択します。

  4. [Specify data store details] (データストア詳細の指定) ページで、データストアに関する基本情報を入力します。

    1. [Data store ID] (データストア ID) に、一意のデータストア ID を入力します。この ID は作成後には変更できません。

    2. (オプション) [Tags] (タグ) で [Add new tag] (新しいタグを追加) を選択すれば、データストアに 1 つまたは複数のカスタムタグ (キーと値のペア) を追加できます。タグを使用すると、AWS IoT Analytics のために作成するリソースを識別することができます。

    3. [Next] (次へ) をクリックします。

  5. [Configure storage type] (ストレージタイプの設定) ページで、データの保存方法を指定します。

    1. [Storage type] (ストレージタイプ) で、[Service managed storage] (サービス管理ストレージ) を選択します。

    2. [Configure how long you want to keep your processed data] (処理データの保存期間の設定) で、[Indefinitely] (無期限) を選択します。

    3. [Next] (次へ) をクリックします。

  6. [Configure data format] (データ形式の設定) ページで、データレコードの構成と形式を定義します。

    1. [Classification] (分類) で、[Parquet] を選択します。データストアを作成した後でこのファイル形式を変更することはできません。

    2. [Inference source] (推論ソース) で、自分のデータストアに対して [JSON string] (JSON 文字列) を選択します。

    3. [String] (文字列) で、スキーマを JSON 形式で入力します。以下はその例です。

      { "device_id": "0001", "temperature": 26, "humidity": 29, "datetime": "2018-01-26T07:06:01" }
    4. [Infer schema] (スキーマの推測) を選択します。

    5. [Configure Parquet schema] (Parquet スキーマの設定) で、その形式が JSON 例に一致しているか確認します。形式が一致しない場合は、Parquet スキーマを手動で更新します。

      • スキーマでより多くの列を表示する場合は、[Add new column] (新しい列の追加) を選択して列名を入力し、データ型を選択します。

        注記

        デフォルトでは、スキーマに 100 列を設定できます。詳細については、AWS IoT Analytics クォータを参照してください。

      • 既存の列のデータ型は変更が可能です。サポートされているデータ型の詳細については、AWS Glue デベロッパーガイドの「共通のデータ型」を参照してください。

        注記

        データストアを作成した後で、既存の列のデータ型を変更することはできません。

      • 既存の列を削除するには、[Remove column] (列の削除) を選択します。

    6. [Next] (次へ) をクリックします。

  7. (オプション) AWS IoT Analytics ではデータストア内のカスタムパーティションがサポートされているため、プルーニングされたデータをクエリすればレイテンシーを改善することができます。サポートされるカスタムパーティションの詳細については、「カスタムパーティション」を参照してください。

    [Next] (次へ) をクリックします。

  8. [Review and create] (確認して作成) ページで、選択内容を認し、[Create data store] (データストアの作成) を選択します。

    重要

    データストアを作成した後で、列のデータストア ID、ファイル形式、データ型を変更することはできません。

  9. [Data stores] (データストア) ページに新しいデータストアが表示されていることを確認します。