関連する時系列データセットの使用 - Amazon Forecast

「翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。」

関連する時系列データセットの使用

関連する時系列データセットには、ターゲット時系列データセットに含まれていない時系列データが含まれており、予測子の精度が向上する場合があります。

たとえば、需要予測ドメインでは、ターゲット時系列データセットには、 timestamp および item_id 属性。一方、補完的な関連する時系列データセットには、次の補足機能も含まれます。item pricepromotion、および weather.

関連する時系列データセットには、最大 10 個の予測ディメンション (ターゲット時系列データセット内のものと同じ) と最大 13 個の関連する時系列機能を含めることができます。

関連する時系列データセットは、 CNN-QR(CNN-QR)ディープAR+、および 預言者 アルゴリズムです。NPTSアリマ、および ETS(エッツ) は、関連する時系列データを受け入れません。

関連の時系列は、次の 2 つの形式で表示されます。

  • 時系列の履歴: 時系列 なし 予測期間内のデータポイント。

  • 将来を見据えた時系列: 時系列 予測期間内のデータポイント。

履歴関連の時系列には、予測期間までのデータポイントが含まれており、予測期間内のデータポイントは含まれません。将来予測に関連する時系列には、以下のデータポイントが含まれます。 および 予測期間内です。

注記

予測期間内の任意の値を含む関連する時系列は、将来の時系列として扱われます。

次の表は、Amazon Forecast の各アルゴリズムが受け付ける関連時系列のタイプを示しています。

CNN-QR(CNN-QR) DeepAR+ Prophet NPTS ARIMA ETS

履歴関連の時系列

将来予想に関する時系列

利用時 AutoMLでは、過去の時系列データおよび将来予測に関連する時系列データの両方を提供できます。また、予測では、該当する時系列のみを使用します。

以下を提供する場合 将来を見据えた 関連する時系列データ、 Forecast 関連データをCNN-QRで使用し、 DeepAR+、および Prophet であり、NPTS、ARIMA、ETS では関連データを使用しません。提供される場合 履歴 関連する時系列データ、 Forecast 関連データはCNN-QRで使用し、関連データはCNN-QRで使用しない DeepAR+、Prophet、NPTS、ARIMA、ETS。

関連する時系列データセットには次の制限があります。

  • ターゲット時系列のターゲット値を含めることはできません。

  • これには、item_id および timestamp ディメンションと、少なくとも 1 つの関連機能 (price など) が含まれている必要があります。

  • 関連する時系列機能データは、int または float データ型である必要があります。

  • ターゲット時系列全体を使用するには、ターゲット時系列データセットのすべての項目も、関連する時系列データセットに含める必要があります。関連時系列に対象時系列からの項目のサブセットのみが含まれている場合、モデル作成と予測生成は項目の特定のサブセットに限定されます。

    たとえば、ターゲット時系列に 1000 項目が含まれ、関連する時系列データセットに 100 項目のみが含まれている場合、モデルと予測は 100 項目のみに基づきます。

  • 関連する時系列データセットにデータを記録する頻度は、予測を生成する間隔 (予測の精度) と一致する必要があります。

    たとえば、週単位の精度で予測を生成する場合、ターゲットの時系列にデータを記録する頻度が毎日であっても、関連する時系列でデータを記録する頻度も週単位である必要があります。

  • 関連する時系列データセット内の各項目のデータは、ターゲット時系列データセット内の対応する item_id の先頭の timestamp またはそれより前に開始する必要があります。

    たとえば、socks のターゲット時系列データが 2019-01-01 に開始し、shoes のターゲット時系列データが 2019-02-01 に開始する場合、socks の関連する時系列データは 2019-01-01 以前、shoes のデータは 2019-02-01 以前に開始する必要があります。

  • 将来予測に関連する時系列データセットでは、すべての項目の最後のタイムスタンプは、ユーザーが指定した予測ウィンドウの最後のタイムスタンプになければなりません( 予測期間)。

    以下の関連する時系列ファイルの例では、靴下と靴の両方の timestamp データは 2019-07-01 (最後に記録されたタイムスタンプ) かつ予測期間の後に終了する必要があります。対象時系列のデータ頻度が日次で、予測期間を 10 日とする場合、2019-07-11 まで、予測に関連する時系列ファイルに日次データポイントを指定する必要があります。

  • 履歴関連の時系列データセットでは、各項目の最後のタイムスタンプが、ターゲット時系列の最後のタイムスタンプと一致する必要があります。

    次の関連する時系列ファイルの例では、 timestamp ソックスとシューズのデータは、2019-07-01(最後に記録されたタイムスタンプ)に終了する必要があります。

  • [ Forecast 関連の時系列データセットで提供されるディメンションは、ターゲット時系列データセットに指定されたディメンションと同じか、またはサブセットである必要があります。

  • 関連時系列に欠落している値を含めることはできません。関連する時系列データセット内の欠落している値については、以下を参照してください。 不足値の処理.

次の表は、正しく設定された関連する時系列データセットファイルを示しています。この例では、次のことを前提としています。

  • 最後のデータポイントは、2019-07-01 にターゲット時系列データセットに記録されました。

  • 予測期間は 10 日です。

  • 予測の精度は毎日です (D)。

A ""行は、前の行と後続の行の間のすべてのデータポイントを示します。

timestamp item_id store price
2019-01-01 socks NYC 10
2019-01-02 socks NYC 10
2019-01-03 socks NYC 15
...
2019-06-01 socks NYC 10
...
2019-07-01 socks NYC 10
...
2019-07-11 socks NYC 20
2019-01-05 socks SFO 45
...
2019-06-05 socks SFO 10
...
2019-07-01 socks SFO 10
...
2019-07-11 socks SFO 30
2019-02-01 shoes ORD 50
...
2019-07-01 shoes ORD 75
...
2019-07-11 shoes ORD 60

次の表は、毎週の粒度で予測するターゲット時系列および関連する時系列の互換性のあるデータ記録頻度を示しています。関連する時系列データセットのデータは集計できないため、 Forecast は、選択した予測粒度と同じ関連する時系列データ頻度のみを受け入れます。

ターゲット入力データの頻度 関連する時系列の頻度 詳細度の予測 Forecast によりサポートされていますか?
1 日 1 回 毎週 毎週 はい
毎週 毎週 毎週 あり
該当なし 毎週 毎週 はい
1 日 1 回 1 日 1 回 毎週 なし