関連する時系列データセットの使用 - Amazon Forecast

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

関連する時系列データセットの使用

関連する時系列データセットには、ターゲット時系列データセットに含まれていない時系列データが含まれており、予測子の精度が向上する場合があります。

例えば、需要予測ドメインで、ターゲット時系列データセットには、timestampitem_id ディメンションが含まれているのに対し、補完的な関連する時系列には、item pricepromotionweather などの追加データ機能も含まれます。

関連する時系列データセットには、最大 10 個の予測ディメンション (ターゲット時系列データセット内のものと同じ) と最大 13 個の関連する時系列機能を含めることができます。

Python ノートブック

aの場合 step-by-step 関連する時系列データセットの使用に関するガイドについては、を参照してください。関連する時系列の組み込み

注記

予測期間内の値を含む関連する時系列は、フォワードルックの時系列として扱われます。

関連する時系列には、次の 2 つの形式があります。

  • 履歴時系列: 予測期間内にデータポイントがない時系列。

  • フォワードルックの時系列: 予測期間内のデータポイントを持つ時系列。

履歴の関連する時系列には、予測期間までのデータポイントが含まれ、予測期間内のデータポイントは含まれません。フォワードルックの関連する時系列には、予測期間までおよび予測期間内のデータポイントが含まれます。

関連する時系列データセットには次の制限があります。

  • ターゲット時系列のターゲット値を含めることはできません。

  • これには、item_id および timestamp ディメンションと、少なくとも 1 つの関連機能 (price など) が含まれている必要があります。

  • 関連する時系列機能データは、int または float データ型である必要があります。

  • ターゲット時系列全体を使用するには、ターゲット時系列データセットのすべてのアイテムも関連する時系列データセットに含まれている必要があります。関連する時系列にターゲット時系列のアイテムのサブセットのみが含まれている場合、モデルの作成と予測の生成は、その特定のアイテムのサブセットに限定されます。

    例えば、ターゲット時系列に 1000 アイテムが含まれ、関連する時系列データセットに 100 アイテムしか含まれていない場合、モデルと予測はそれらの 100 アイテムのみに基づきます。

  • 関連する時系列データセットにデータを記録する頻度は、予測を生成する間隔 (予測の精度) と一致する必要があります。

    たとえば、週単位の精度で予測を生成する場合、ターゲットの時系列にデータを記録する頻度が毎日であっても、関連する時系列でデータを記録する頻度も週単位である必要があります。

  • 関連する時系列データセット内の各項目のデータは、ターゲット時系列データセット内の対応する item_id の先頭の timestamp またはそれより前に開始する必要があります。

    たとえば、socks のターゲット時系列データが 2019-01-01 に開始し、shoes のターゲット時系列データが 2019-02-01 に開始する場合、socks の関連する時系列データは 2019-01-01 以前、shoes のデータは 2019-02-01 以前に開始する必要があります。

  • フォワードルックの関連する時系列データセットについては、すべての項目の最後のタイムスタンプは、ユーザーが指定した予測ウィンドウ (予測期間と呼ばれます) の最後のタイムスタンプ上にある必要があります。

    以下の関連する時系列ファイルの例では、靴下と靴の両方の timestamp データは 2019-07-01 (最後に記録されたタイムスタンプ) かつ予測期間の後に終了する必要があります。ターゲット時系列のデータ頻度が毎日で、予測期間が 10 日である場合、2019-07-11 までは、フォワードルックの関連する時系列ファイルで毎日のデータポイントを指定する必要があります。

  • 履歴の関連する時系列データセットについては、すべてのアイテムの最後のタイムスタンプは、ターゲットの時系列の最後のタイムスタンプと一致する必要があります。

    以下の関連する時系列ファイルの例では、靴下と靴の両方の timestamp データは 2019-07-01 (最後に記録されたタイムスタンプ) に終了する必要があります。

  • 関連する時系列データセットで指定される Forecast ディメンションは、ターゲット時系列データセットで指定されたディメンションと等しいか、サブセットである必要があります。

  • 関連する時系列に欠落値を含めることはできません。関連する時系列データセットの欠落した値については、「欠落した値の処理」を参照してください。

次の表は、正しく設定された関連する時系列データセットファイルを示しています。この例では、次のことを前提としています。

  • 最後のデータポイントは、2019-07-01 にターゲット時系列データセットに記録されました。

  • 予測期間は 10 日です。

  • 予測の精度は毎日です (D)。

」行は、前の行と後続の行の間にあるすべてのデータポイントを示します。

timestamp item_id store price
2019-01-01 socks NYC 10
2019-01-02 socks NYC 10
2019-01-03 socks NYC 15
...
2019-06-01 socks NYC 10
...
2019-07-01 socks NYC 10
...
2019-07-11 socks NYC 20
2019-01-05 socks SFO 45
...
2019-06-05 socks SFO 10
...
2019-07-01 socks SFO 10
...
2019-07-11 socks SFO 30
2019-02-01 shoes ORD 50
...
2019-07-01 shoes ORD 75
...
2019-07-11 shoes ORD 60

次の表は、ターゲット時系列および関連する時系列について週単位の精度で予測する、互換性のあるデータ記録頻度を示します。関連する時系列データセットのデータは集計できないため、Forecast は、選択した詳細度と同じ関連する時系列のデータ頻度のみを受け入れます。

ターゲット入力データの頻度 関連する時系列の頻度 詳細度の予測 Forecast でのサポート
1 日 1 回 毎週 毎週 はい
毎週 毎週 毎週 はい
該当なし 毎週 毎週 はい
1 日 1 回 1 日 1 回 毎週 なし
注記

既存の予測子を AutoPredictor にアップグレードするには、「AutoPredictor へのアップグレード」を参照してください。

従来の予測子を使用する場合、CNN-QRDeepAR +、および Prophet のアルゴリズムを使用して予測子をトレーニングするときに、関連する時系列データセットを使用できます。NPTSARIMA、および ETS は、関連する時系列データを受け入れません。

次の表は、Amazon Forecast の各アルゴリズムが受け入れる、関連する時系列のタイプを示しています。

CNN-QR DeepAR+ Prophet NPTS ARIMA ETS

履歴の関連する時系列

フォワードルックの時系列

AutoML を使用する場合、履歴の関連する時系列データとフォワードルックの関連する時系列データの両方を提供でき、Forecast は該当する場合にのみそれらの時系列を使用します。

フォワードルックの関連する時系列データを提供する場合、Forecast は、CNN-QR、DeepAR+、および Prophet で関連データを使用し、NPTS、ARIMA、および ETS で関連データを使用しません。履歴の関連する時系列データが提供された場合、Forecast は、CNN-QR で関連データを使用し、DeepAR+、Prophet、NPTS、ARIMA、および ETS で関連データを使用しません。