Forecast のデータセットのガイドライン - Amazon Forecast

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Forecast のデータセットのガイドライン

Amazon Forecast がデータセットのインポートに失敗する場合、またはデータセットが期待どおりに機能しない場合は、次のガイドラインを参照してください。

タイムスタンプ形式

年 (Y)、月 (M)、週 (W)、および日 (D) の収集頻度の場合、Forecast は yyyy-MM-dd タイムスタンプ形式 (例: 2019-08-21) と、オプションで HH:mm:ss 形式 (例: 2019-08-21 15:00:00) をサポートします。

時 (H) と分 (M) の頻度では、Forecast は yyyy-MM-dd HH:mm:ss 形式 (例: 2019-08-21 15:00:00) のみをサポートしています。

ガイドライン: データセットの収集頻度のタイムスタンプ形式をサポートされている形式に変更します。

Amazon S3 ファイルまたはバケット

データセットをインポートするとき、データを含む Amazon Simple Storage Service (Amazon S3) バケットの CSV または Parquet ファイルへのパス、またはデータを含む S3 バケットの名前を指定できます。CSV ファイルまたは Parquet ファイルを指定すると、Forecast はそのファイルだけをインポートします。S3 バケットを指定すると、Forecast はバケット内のすべての CSV または Parquet ファイルを最大 10,000 ファイルをインポートします。バケット名を指定して複数のファイルをインポートする場合は、すべての CSV または Parquet ファイルが、指定されたスキーマに準拠する必要があります。

ガイドライン: 次の構文を使用して、特定のファイルまたは S3 バケットを指定します。

s3://bucket-name/example-object.csv

s3://bucket-name/example-object.parquet

s3://bucket-name/prefix/

s3://bucket-name

Parquet ファイルには、.parquet、.parq、.pqt という拡張子を付けることもできますが、拡張子をまったく付けなくてもかまいません。

データセットの完全更新

最初のデータセットのインポートは常に完全インポートで、それ以降のインポートは完全更新でも増分更新でもかまいません。Forecast API を使用してインポートモードを指定する必要があります。

完全更新では、既存のデータはすべて新しくインポートされたデータに置き換えられます。データセットの完全インポートジョブは集計されないため、最新のデータセットインポートは、予測子のトレーニング時や予想の生成時に使用されるものです。

ガイドライン: データセットを段階的に更新して、新しいデータを既存のデータに追加します。そうしない場合、最新のデータセットインポートに、前回のインポート以降に収集された新しいデータだけでなく、モデル化するすべてのデータが含まれていることを確認します。

データセットの増分更新

タイムスタンプ、データ形式、位置情報などのフィールドは、現在アクティブなデータセットから読み取られます。この情報をデータセットの増分インポートに含める必要はありません。これらが含まれる場合は、元々提供されていた値と一致する必要があります。

ガイドライン: これらの値を変更する場合は、データセット全体をインポートしてください。

属性の順序

スキーマ定義で指定された属性の順序は、インポートする CSV または Parquet ファイルの列の順序と一致する必要があります。たとえば、最初の属性として timestamp を定義した場合、timestamp は入力ファイルの最初の列でもある必要があります。

ガイドライン: 入力ファイルの列が、作成したスキーマ属性と同じ順序であることを確認してください。

Weather Index

Weather Index を適用するには、ターゲットの時系列および関連する時系列データセットに geolocation 属性を含める必要があります。また、ターゲットの時系列タイムスタンプのタイムゾーンを指定する必要があります。

ガイドライン: データセットに geolocation 属性が含まれており、タイムスタンプにタイムゾーンが割り当てられているようにしてください。詳細については、Weather Index の「Conditions and Restrictions」(条件と制約事項) を参照してください。

データセットヘッダー

入力 CSV のデータセットヘッダーにより、検証エラーが発生する場合があります。CSV ファイルではヘッダーを省略することをお勧めします。

ガイドライン: データセットヘッダーを削除し、インポートを再試行します。

Parquet ファイルにはデータセットヘッダーが必要です。

データセットのステータス

CreateDatasetImportJob オペレーションでトレーニングデータをインポートするには、データセットの StatusACTIVE である必要があります。

ガイドライン: DescribeDataset オペレーションを使用して、データセットのステータスを取得します。データセットの作成または更新に失敗した場合は、データセットファイルの形式を確認して、もう一度作成してください。

デフォルトファイル形式

デフォルトのファイル形式は CSV です。

ファイル形式と区切り記号

Forecast では、カンマ区切り値 (CSV) ファイル形式と Parquet 形式のみがサポートされています。タブ、スペース、コロン、またはその他の文字を使用して値を区切ることはできません。

ガイドライン: データセットを CSV 形式 (区切り文字としてカンマのみを使用) または Parquet 形式に変換し、ファイルのインポートを再試行します。

ファイル名

ファイル名には、アルファベットを 1 文字以上含める必要があります。名前が数値のみのファイルはインポートできません。

ガイドライン: 少なくともアルファベットが 1 文字以上含まれるように入力データファイルの名前を変更し、ファイルのインポートを再試行します。

パーティショニングされた Parquet データ

Forecast は、パーティショニングされた Parquet ファイルを読み取りません。

What-If 分析のデータセット要件

What-If 分析には CSV データセットが必要です。CreateWhatIfAnalysis アクションの TimeSeriesSelector オペレーションと の TimeSeriesReplacementDataSource オペレーションは Parquet ファイルを受け入れCreateWhatIfForecastません。