Amazon SageMaker Canvas での時系列予測 - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker Canvas での時系列予測

注記

時系列予測モデルは表形式のデータセットでのみサポートされています。

Amazon SageMaker Canvas では、機械学習の時系列予測を使用できます。時系列予測では、時間によって変化する予測を行うことができます。

時系列予測は、以下のような例に使用できます。

  • 今後数か月の在庫を予測する。

  • 今後 4 か月間に販売される商品の数。

  • ホリデーシーズン期間中に販売価格を引き下げることによる影響。

  • 今後 12 か月間の商品の在庫。

  • 今後数時間以内に店舗に入店する顧客の数。

  • 商品価格の 10% 引き下げが一定の期間における売上高に及ぼす影響の予測。

時系列予測を行うには、データセットに以下のものが必要です。

  • datetimeそのタイプのすべての値を含むタイムスタンプ列。

  • 未来の値を予測するために使用する値が入ったターゲット列。

timestampdatetime 列の値は、次のいずれかの形式を使用する必要があります。

  • YYYY-MM-DD HH:MM:SS

  • YYYY-MM-DDTHH:MM:SSZ

  • YYYY-MM-DD

  • MM/DD/YY

  • MM/DD/YY HH:MM

  • MM/DD/YYYY

  • YYYY/MM/DD HH:MM:SS

  • YYYY/MM/DD

  • DD/MM/YYYY

  • DD/MM/YY

  • DD-MM-YY

  • DD-MM-YYYY

次の間隔の予測を行うことができます。

  • 1 分

  • 5 分

  • 15 分

  • 30 分

  • 1 時間

  • 1 日

  • 1 週間

  • 1 月 1

  • 1 年

予測精度を高めるために、データセットには、ターゲット列の変動を説明するデータが入った列を追加することもできます。説明のための追加の列を使用すると、ターゲット列の将来の値をより正確に予測できる場合があります。

食料品店が販売するアイスクリームの量の予測などに使用できます。予測を行うには、タイムスタンプ列と、食料品店が販売したアイスクリームの量を示す列が必要です。より正確な予測のために、データセットに価格、外界温度、アイスクリームのフレーバー、またはアイスクリームの一意の識別子を含めることもできます。

気温が暖かいとアイスクリームの売上が増える可能性があります。アイスクリームの値下げが、販売数の増加につながることもあります。外界温度データの列と価格データの列があると、食料品店が販売するアイスクリームの個数をより正確に予測できます。

さまざまな理由でデータが欠落している場合もあります。データが欠落している理由がわかれば、Amazon SageMaker Canvas での計算方法を特定できるかもしれません。例えば、組織では、販売が発生したときのみ追跡する自動システムが使用されることがあります。このようなタイプの自動システムからのデータセットを使用すると、ターゲット列の値が欠落します。

データセットの欠損値については、 SageMaker Canvas が欠損値を自動的に補います。

重要

ターゲット列に欠落した値がある場合は、そのような値のないデータセットを使用することをお勧めします。 SageMaker Canvas はターゲット列を使用してfuture 値を予測します。ターゲット列の値が欠落していると、予測の精度が大幅に低下することがあります。

以下のいずれかのタイプの予測を行うことができます。

  • 1 つの項目

  • すべてのアイテム

データセット内のすべてのアイテムに対する予測では、 SageMaker Canvas はデータセット内の各項目のfuture 値の予測を返します。

1 つの項目に対する予測の場合は、 SageMaker Canvas は指定した項目に対するfuture 値の予測を返します。予測では、予測値を時系列でプロットする折れ線グラフも表示されます。