事前定義済みのデータセットドメインとデータセットタイプ - Amazon Forecast

「翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。」

事前定義済みのデータセットドメインとデータセットタイプ

予測子をトレーニングするには、1 つまたは複数のデータセットを作成し、データセットグループに追加して、トレーニング用のデータセットグループを提供します。

作成したデータセットごとに、データセットドメインとデータセットタイプを関連付けます。データセットドメインは、一般的ユースケースのために事前定義されたデータセットスキーマを指定し、モデルアルゴリズムやハイパーパラメータには影響しません。

Amazon Forecast では、以下のデータセットドメインがサポートされています。

ドメインごとに、1~3 つのデータセットタイプがあります。ドメイン用に作成するデータセットタイプは、所有しているデータのタイプとトレーニングに含めるものに基づいています。

各ドメインにはターゲット時系列データセットが必要です。オプションで、関連する時系列および項目メタデータデータセットタイプをサポートします。

データセットタイプは次のとおりです。

  • ターゲット時系列 – 唯一必要なデータセットタイプ。このタイプは、予測を生成するターゲットフィールドを定義します。たとえば、一連の製品の売上を予測する場合は、予測する製品ごとに履歴の時系列データのデータセットを作成する必要があります。同様に、予測する収益、キャッシュフローおよび売上など、メトリクス用のターゲット時系列データセットを作成できます。

  • 関連する時系列 – ターゲットの時系列データに関連する時系列データ。たとえば、価格は製品の売上データに関連しているため、関連する時系列として指定できます。

  • 項目メタデータ – ターゲットの時系列データに適用可能なメタデータ。たとえば、特定の商品の売上を予測している場合、商品の属性 (ブランド、色、ジャンルなど) は、項目メタデータの一部になります。EC2 インスタンスの EC2 キャパシティを予測するとき、メタデータにはインスタンスタイプの CPU とメモリが含まれる場合があります。

データセットのタイプごとに、入力データに特定の必須フィールドが含まれている必要があります。Amazon Forecast が提案したオプションのフィールドを含めることもできます。

次の例は、データセットドメインとそれに対応するデータセットタイプを選択する方法を示しています。

例 1: RETAIL ドメインのデータセットタイプ

商品の需要予測に関心のある小売業者であれば、RETAIL ドメインに次のデータセットを作成できます。

  • ターゲット時系列は、各アイテム (小売業者が販売する各製品) の履歴時系列需要 (売上) データの必須データセットです。RETAIL ドメインでは、このデータセットタイプでは、データセットに item_idtimestamp、および demand の各フィールドが含まれている必要があります。demand フィールドは予測ターゲットであり、通常は特定の週または日に小売業者によって販売された商品の数です。

  • オプションで、関連する時系列タイプのデータセット。RETAIL ドメインでは、このタイプには priceinventory_onhandwebpage_hits などのオプションの、ただし推奨される時系列情報を含めることができます。

  • オプションで、項目メタデータタイプのデータセット。RETAIL ドメインでは、Amazon Forecast は brandcolorcategory、および genre など、ターゲット時系列で提供した項目に関連するメタデータ情報を提供することをお勧めします。

例 2: METRICS ドメインのデータセットタイプ

収益、売上、キャッシュフローなど、組織の主要なメトリクスを予測する場合は、次のデータセットを Amazon Forecast に提供できます。

  • 予測するメトリクスの履歴時系列データを提供するターゲット時系列データセット。組織内のすべてのビジネスユニットの収益を予測する場合は、metricbusiness unit、および metric_value の各フィールドを使用して target time series データセットを作成できます。

  • categorylocation など、必要とされない各メトリクスのメタデータがある場合は、関連する時系列および項目メタデータタイプのデータセットを提供します。

ターゲットメトリクスの予測を生成するには、少なくとも Forecast のターゲット時系列データセットを提供する必要があります。

例 3: CUSTOM ドメインのデータセットタイプ

予測アプリケーションのトレーニングデータは、どの Amazon Forecast ドメインにも適合しない可能性があります。そのような場合は、CUSTOM ドメインを選択してください。ターゲット時系列データセットを提供する必要がありますが、独自のカスタムフィールドを追加することができます。

Getting Started 演習では、クライアントの電力使用量を予測します。電力使用量トレーニングデータはどのデータセットドメインにも適合しないため、CUSTOM ドメインを使用しました。この演習では、ターゲット時系列タイプという 1 つのデータセットタイプのみを使用します。データフィールドをデータセットタイプに必要な最小フィールドにマップします。