関連する時系列データセットの使用 - Amazon Forecast

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

関連する時系列データセットの使用

関連する時系列データセットには、ターゲット時系列データセットに含まれていない時系列データが含まれており、予測子の精度が向上する場合があります。

たとえば、需要予測ドメインで、ターゲット時系列データセットには、timestampおよびitem_idディメンション、相補的な関連時系列データセットには、次の補足フィーチャも含まれています。item price,promotion, およびweather

関連する時系列データセットには、最大 10 個の予測ディメンション (ターゲット時系列データセット内のものと同じ) と最大 13 個の関連する時系列機能を含めることができます。

関連する時系列データセットを使用して、予測変数をトレーニングすることができます。CNN-QR,DeepAR+, およびProphetアルゴリズム。NPTS,ARIMA, およびETSは、関連する時系列データを受け入れません。

Python ノートブック

関連する時系列データセットの使用手順については、」関連する時系列を組み込む

関連する時系列には、次の 2 つの形式があります。

  • 時系列履歴: 時系列なしで予測期間内のデータポイント。

  • 将来を見据えた時系列: 時系列予測期間内のデータポイント。

履歴関連の時系列には、予測範囲までのデータポイントが含まれ、予測範囲内のデータポイントは含まれません。将来を見据えた関連時系列には、および予測期間内。

注記

予測範囲内の値を含む関連する時系列は、将来を見据えた時系列として扱われます。

次の表に、各 Amazon Forecast アルゴリズムで受け入れられる関連する時系列のタイプを示します。

CNN-QR DeepAR+ Prophet NPTS ARIMA ETS

関連する時系列

前方関連時系列

AutoML を使用する場合、履歴および将来の関連時系列データの両方を提供できます。Forecast は、該当する場合のみそれらの時系列を使用します。

あなたが提供する場合将来を見据える関連する時系列データを使用する場合、ForecastはCNN-QR、Deepar+、Prophetと関連データを使用し、NPTS、ARIMA、ETSとの関連データを使用しません。提供されている場合歴史的関連する時系列データを使用する場合、ForecastはCNN-QRと関連データを使用し、Deepar+、Prophet、NPTS、ARIMA、ETSと関連データを使用しません。

関連する時系列データセットには次の制限があります。

  • ターゲット時系列のターゲット値を含めることはできません。

  • これには、item_id および timestamp ディメンションと、少なくとも 1 つの関連機能 (price など) が含まれている必要があります。

  • 関連する時系列機能データは、int または float データ型である必要があります。

  • ターゲット時系列全体を使用するには、ターゲット時系列データセットのすべての項目も、関連する時系列データセットに含める必要があります。関連する時系列にターゲット時系列の品目のサブセットのみが含まれている場合、モデルの作成と予測生成は、品目のその特定のサブセットに限定されます。

    たとえば、ターゲット時系列に1000個のアイテムが含まれ、関連する時系列データセットに100個のアイテムしか含まれていない場合、モデルと予測は100個のアイテムのみに基づきます。

  • 関連する時系列データセットにデータを記録する頻度は、予測を生成する間隔 (予測の精度) と一致する必要があります。

    たとえば、週単位の精度で予測を生成する場合、ターゲットの時系列にデータを記録する頻度が毎日であっても、関連する時系列でデータを記録する頻度も週単位である必要があります。

  • 関連する時系列データセット内の各項目のデータは、ターゲット時系列データセット内の対応する item_id の先頭の timestamp またはそれより前に開始する必要があります。

    たとえば、socks のターゲット時系列データが 2019-01-01 に開始し、shoes のターゲット時系列データが 2019-02-01 に開始する場合、socks の関連する時系列データは 2019-01-01 以前、shoes のデータは 2019-02-01 以前に開始する必要があります。

  • 前方参照に関連する時系列データセットの場合、すべての項目の最後のタイムスタンプは、ユーザーが指定した予測ウィンドウの最後のタイムスタンプである必要があります (予測期間).

    以下の関連する時系列ファイルの例では、靴下と靴の両方の timestamp データは 2019-07-01 (最後に記録されたタイムスタンプ) かつ予測期間の後に終了する必要があります。ターゲット時系列のデータ頻度が毎日で、予測期間が 10 日である場合、2019-07-11 までは、将来の見通しに関連する時系列ファイルで毎日のデータポイントを指定する必要があります。

  • 履歴関連時系列データセットの場合、各アイテムの最終タイムスタンプは、ターゲット時系列内の最終タイムスタンプと一致する必要があります。

    以下の関連時系列ファイルの例では、timestamp靴下と靴の両方のデータは 2019-07-01 (最後に記録されたタイムスタンプ) に終了する必要があります。

  • 関連する時系列データセットで指定される Forecast ディメンションは、ターゲット時系列データセットで指定されたディメンションと等しいか、サブセットである必要があります。

  • 関連する時系列に欠損値を持つことはできません。関連する時系列データセットの欠落した値については、」欠落した値の処理

次の表は、正しく設定された関連する時系列データセットファイルを示しています。この例では、次のことを前提としています。

  • 最後のデータポイントは、2019-07-01 にターゲット時系列データセットに記録されました。

  • 予測期間は 10 日です。

  • 予測の精度は毎日です (D)。

A」「行は、前の行と後続の行の間にあるすべてのデータポイントを示します。

timestamp item_id store price
2019-01-01 socks NYC 10
2019-01-02 socks NYC 10
2019-01-03 socks NYC 15
...
2019-06-01 socks NYC 10
...
2019-07-01 socks NYC 10
...
2019-07-11 socks NYC 20
2019-01-05 socks SFO 45
...
2019-06-05 socks SFO 10
...
2019-07-01 socks SFO 10
...
2019-07-11 socks SFO 30
2019-02-01 shoes ORD 50
...
2019-07-01 shoes ORD 75
...
2019-07-11 shoes ORD 60

次の表は、ターゲット時系列および関連する時系列について週単位の精度で予測する、互換性のあるデータ記録頻度を示します。関連する時系列データセットのデータは集計できないため、Forecast は、選択した詳細度と同じ関連する時系列のデータ頻度のみを受け入れます。

ターゲット入力データの頻度 関連する時系列の頻度 詳細度の予測 Forecastによってサポートされていますか?
1 日 1 回 毎週 毎週 はい
毎週 毎週 毎週 はい
該当なし 毎週 毎週 はい
1 日 1 回 1 日 1 回 毎週 いいえ