データフィード - AWS Marketplace

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

データフィード

AWS Marketplace は、製品の販売に関する情報を販売者が収集および分析する際に役立つ複数のデータフィードを提供しています。データフィードは、AWS Marketplace のすべての登録販売者が利用できます。データフィードは 1 日以内に生成されるため、最新のデータを利用できます。

このページでは、データフィードの概要を示し、データフィードにアクセスして使用する方法について説明します。以降のページでは、各データフィードについて説明します。

データフィードの保存と構造

データフィードは、コンマ区切り値 (CSV) ファイルを収集し、これを指定先の暗号化された Amazon S3 バケットに配信します。CSV ファイルの特性は次のとおりです。

  • 4180 標準に準拠しています。

  • 文字エンコーディングは UTF-8 (BOM なし) です。

  • カンマは、値間の区切り文字として使用されます。

  • フィールドは二重引用符でエスケープ

  • \n は改行文字です。

  • 日付は UTC タイムゾーンで報告され、日時形式は ISO 8601 に従い、精度は 1 秒以内です。

  • すべての *_period_start_date 値および *_period_end_date 値は包括的です。つまり、23:59:59 は任意の日の最後のタイムスタンプです。

  • すべての金銭情報フィールドの先頭に通貨フィールドが付きます。

  • 金銭情報フィールドでは、小数点の区切り文字としてピリオド (.) を使用し、3 桁の区切り文字としてカンマ (,) を使用しません。

データフィードは次のように生成されて保存されます。

  • データフィードは 1 日以内に生成され、前日の 24 時間のデータが含まれます。

  • Amazon S3 バケットの場合、データフィードは次の形式を使用して月別に整理されます。

    bucket-name/data-feed-name_version/year=YYYY/month=MM/data.csv

  • 毎日のデータフィードが生成されると、当月の既存の CSV ファイルに追加されます。新しい月が始まると、データフィードごとに新しい CSV ファイルが生成されます。

  • データフィードの情報は 2010/01/01 から 2020/04/30 (含む) までバックフィルされ、CSV ファイルのyear=2010/month=01サブフォルダ。

    特定のデータフィードの当月のファイルに列ヘッダーのみが含まれ、データが含まれていない場合があります。これは、当月のフィードに新しいエントリがなかったことを意味します。製品フィードなど、更新頻度が低いデータフィードで発生する場合があります。このような場合、データはバックフィルされたフォルダで利用できます。

  • Amazon S3 では、以下を作成できます。Amazon S3 ライフサイクルポリシーバケットにファイルを保持する期間を管理します。

  • 暗号化された S3 バケットにデータが配信されたときに通知するように Amazon SNS を設定できます。通知の設定方法については、「Amazon SNS の開始方法Amazon Simple Notification Service デベロッパーガイド

データの履歴化

各データフィードには、データの履歴を示す列があります。valid_to を除き、これらの列はすべてのデータフィードに共通です。これらは共通の履歴スキーマとして含まれており、データのクエリに役立ちます。

列名 説明
valid_from 主キーの値が他のフィールドの値に関連して有効である最初の日付。
valid_to この列は住所データフィードにのみ表示され、常に空白です。
insert_date レコードがデータフィードに挿入された日付。
update_date レコードが最後に更新された日付。
delete_date この列は常に空白です。

これらの列の例を次に示します。

valid_from valid_to insert_date update_date delete_date
2018-12:00:00 2018-12:00:00 2018-12:00:00
2019-03-29-03-29:00:00 2019-03-29-03-29:00:00 2019-03-29-03-29:00:00
2019-03-29-03-29:00:00 2019-03-29-03-29:00:00 2019-03-28T 03:00:00

-valid_fromそしてupdate_dateフィールドが一緒になってバイテンポラルデータモデル。-valid_fromフィールドは、その名前のとおり、項目がいつから有効になるかを示します。アイテムが編集された場合、フィードに複数のレコードを含めることができ、それぞれに異なるupdate_date、しかし同じvalid_from日付. たとえば、項目の現在の値を見つけるには、最も新しいレコードを検索します。update_date、最新のレコードのリストからvalid_from日付.

上の例では、レコードは元々 2018-12-12 に作成されました。その後、2019-03-29 に変更されました (たとえば、レコードの住所が変更された場合)。その後、2019-04-28に、住所の変更が修正されました(そのため、valid_from変わらなかったけどupdate_dateやった)。住所を修正する(まれなイベント)と、元のレコードから遡ってレコードが変更されるvalid_fromdate、そのフィールドは変更されませんでした。最新のものを検索するクエリvalid_from2つのレコードを返します。1つは最新のレコードですupdate_date実際の現在のレコードを表示します。

データフィードへのアクセス

データフィードにアクセスするには、暗号化された Amazon S3 バケットをデータフィードの送信先とするように環境を設定する必要があります。AWS Marketplaceの提供されるAWS CloudFormationテンプレート構成を簡略化するために使用できます。

AWS CloudFormation テンプレートを使用してデータフィードを受信するように環境を設定するには

  1. Web ブラウザを開き、AWS Marketplace 管理ポータルその後、顧客データストレージの設定

  2. [Create resources with AWS CloudFormation (CloudFormatiion テンプレートを使用してリソースを作成する)] を選択して、AWS CloudFormation コンソールの別のウィンドウでテンプレートを開きます。

  3. テンプレートで以下を指定し、[Next (次へ)] を選択します。

    • スタック名 — データフィードへのアクセスを有効にするために作成するリソースのコレクション。

    • Amazon S3 バケット名 — データフィードを保存する先のバケット。

    • (オプション) Amazon SNS トピック名 — 次の場合に通知を受信するためのトピックAWS新しいデータを Amazon S3 バケットに配信します。

  4. [Review (確認)] ページで入力内容を確認し、[Create stack (スタックの作成)] を選択します。これにより、新しいページが開き、 CloudFormation ステータスと詳細

  5. Fromリソースタブで、次のリソースの Amazon リソースネーム (ARN) を CloudFormation のページで、AWS Marketplace 顧客データストレージの設定ページ:

    • データフィードを保存するための Amazon S3 先のバケット

    • AWS KMSAmazon S3 バケットを暗号化するキー

    • (オプション) 次の場合に通知を受信するための Amazon SNS トピックAWSAmazon S3 バケットに新しいデータを配信します

  6. [Set up customer data storage (顧客データストレージの設定)] ページで、[Submit (送信)] を選択します。

  7. (オプション) によって作成されるポリシーを編集します。 CloudFormation テンプレート. 詳細については、データフィードのポリシー をご覧ください。

これで、データフィードにサブスクライブしました。次回にデータフィードが生成されると、データにアクセスできます。

の詳細AWS CloudFormationテンプレート、参照の使用AWS CloudFormationテンプレートAWS CloudFormationユーザーガイド

データフィードのポリシー

Amazon S3 バケットが CloudFormation テンプレートを作成すると、そのバケットにアタッチされたアクセスに関するポリシーが作成され、AWS KMSキーと Amazon SNS トピックを参照してください。ポリシーでは、AWS Marketplaceレポートサービスは、データフィード情報を使用してバケットと SNS トピックに書き出します。各ポリシーには次のようなセクションがあります (この例は Amazon S3 バケットからのものです)。

{ "Sid": "AwsMarketplaceDataFeedsAccess", "Effect": "Allow", "Principal": { "Service": "reports.marketplace.amazonaws.com" }, "Action": [ "s3:ListBucket", "s3:GetObject", "s3:PutObject", "s3:GetEncryptionConfiguration", "s3:GetBucketAcl", "s3:PutObjectAcl" ], "Resource": [ "arn:aws:s3:::datafeed-bucket", "arn:aws:s3:::datafeed-bucket/*" ] },

このポリシーでは、reports.marketplace.amazonaws.comサービスプリンシパルはAWS Marketplaceを使用してデータを Amazon S3 バケットにプッシュします。-datafeed-bucketで指定したバケットは CloudFormation テンプレート.

の時期AWS MarketplaceAmazon S3のサービスコールを報告し、AWS KMS、または Amazon SNS の場合、バケットに書き込む予定のデータの ARN を提供します。バケットに書き込まれるデータだけがユーザーに代わって書き込まれるようにするには、aws:SourceArnポリシーの条件で。次の例では、account-idのIDを使用したAWS アカウント。

{ "Sid": "AwsMarketplaceDataFeedsAccess", "Effect": "Allow", "Principal": { "Service": "reports.marketplace.amazonaws.com" }, "Action": [ "s3:ListBucket", "s3:GetObject", "s3:PutObject", "s3:GetEncryptionConfiguration", "s3:GetBucketAcl", "s3:PutObjectAcl" ], "Resource": [ "arn:aws:s3:::datafeed-test-bucket", "arn:aws:s3:::datafeed-test-bucket/*" , "Condition": { "StringEquals": { "aws:SourceAccount": "account-id", "aws:SourceArn": ["arn:aws:marketplace::account-id:AWSMarketplace/SellerDataSubscription/DataFeeds_V1", "arn:aws:marketplace::account-id:AWSMarketplace/SellerDataSubscription/Example-Report"] } } },

データフィードの登録解除

Web ブラウザを開き、AWS Marketplace Management Portal。その後、問い合わせページをクリックして AWS Marketplace マネージドカタログ業務チーム (MCO) チームに登録解除リクエストを送信する。登録解除リクエストの送信には、最大 10 営業日かかることがあります。

データフィードの使用

Amazon S3 バケットのデータが使用可能な場合、次の方法でデータフィードを使用できます。

  • 「」で作成した Amazon S3 バケットから .CSV ファイルをダウンロードするデータフィードへのアクセスこれにより、スプレッドシートでデータを表示することができます。

  • ETL (抽出、変換、ロード)、SQLクエリ、ビジネス分析ツールを使用して、データを収集して分析します。

    データを収集して分析するには、AWS のサービスを使用するか、.CSV ベースのデータセットの分析を実行できるサードパーティー製のツールを使用できます。

例: を使用するAWSデータを収集して分析するサービス

次の手順では、データフィードの送信先を Amazon S3 バケットとするように環境を設定済みであり、バケットにデータフィードが含まれていることを前提としています。

データフィードからデータを収集して分析するには

  1. FromAWS Glueコンソール,クローラを作成するデータフィードを格納する Amazon S3 バケットに接続し、必要なデータを抽出し、メタデータテーブルをAWS Glue Data Catalog。

    AWS Glue の詳細については、「AWS Glue デベロッパーガイド」を参照してください。

  2. FromAthena コンソール,データに対して SQL クエリを実行します。AWS Glue Data Catalog

    Athena の詳細については、Athena の詳細については、Amazon Athena ユーザーガイド

  3. Fromアマゾン QuickSight コンソール,分析の作成そしてそれからビジュアルを作成するデータの。

    Amazon の詳細 QuickSight「」を参照してください。アマゾン QuickSight ユーザーガイド

1つの使用方法の詳細な例についてはAWSデータフィードのデータを収集して分析するサービス。売り手データフィード配信サービス、Amazon Athena、Amazonを使用する QuickSight 販売者レポートを作成するにはでAWS Marketplaceブログ.