Forecast のデータセットガイドライン - Amazon Forecast

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Forecast のデータセットガイドライン

Amazon Forecast がデータセットのインポートに失敗する場合、またはデータセットが期待どおりに機能しない場合は、以下のガイドラインを参照してください。

タイムスタンプ形式

年 (Y)、月 (M), 週 (W)、日 (D) の収集頻度、Forecastはyyyy-MM-ddタイムスタンプ形式 (例:2019-08-21)、オプションでHH:mm:ss形式 (たとえば、2019-08-21 15:00:00).

時間 (H) と分 (M) の周波数の場合、Forecastはyyyy-MM-dd HH:mm:ss形式 (たとえば2019-08-21 15:00:00).

ガイドライン: データセットの収集頻度のタイムスタンプ形式をサポートされている形式に変更します。

Amazon S3 ファイルまたはバケット

データセットをインポートするとき、データを含む Amazon Simple Storage Service (Amazon S3) バケットの CSV ファイルへのパス、またはデータを含む S3 バケットの名前を指定できます。CSV ファイルを指定すると、Forecast はそのファイルのみをインポートします。S3 バケットを指定すると、Forecast では、バケット内のすべての CSV ファイルが最大 10,000 ファイルインポートされます。バケット名を指定して複数のファイルをインポートする場合は、すべての CSV ファイルが、指定されたスキーマに準拠する必要があります。

ガイドライン: 次の構文を使用して、CSV ファイルまたは S3 バケットを指定します。

s3://bucket-name/example-object.csv

s3://bucket-name/prefix/

s3://bucket-name

データセットの更新

データセットのインポートジョブは集計されないため、最新のデータセットインポートは、予想子のトレーニング時や予測の生成時に使用されるものです。

ガイドライン: 最新のデータセットインポートに、前回のインポート以降に収集された新しいデータだけでなく、モデル化するすべてのデータが含まれていることを確認します。

属性の順序

スキーマ定義で指定された属性の順序は、インポートする CSV ファイルの列の順序と一致する必要があります。たとえば、最初の属性として timestamp を定義した場合、timestamp は入力 CSV ファイルの最初の列でもある必要があります。

ガイドライン: CSV ファイルの列が、作成したスキーマ属性と同じ順序であることを確認してください。

気象索引

天気指数を適用するには、位置情報属性ターゲット時系列および関連する時系列データセット内の。また、指定する必要があります[タイムゾーン]をターゲット時系列のタイムスタンプに設定します。

ガイドライン: データセットにジオロケーション属性が含まれていること、およびタイムスタンプにタイムゾーンが割り当てられていることを確認します。詳細は、気象指数を参照してください。条件と制限

データセットヘッダー

入力 CSV ファイルのデータセットヘッダーにより、検証エラーが発生する場合があります。ヘッダーを省略することをお勧めします。

ガイドライン: データセットヘッダーを削除し、インポートを再試行します。

データセットのステータス

トレーニングデータをインポートするには、 CreateDatasetImportJob オペレーションの場合、Statusは、データセットのACTIVE

ガイドライン: を使用する DescribeDataset オペレーションを使用して、データセットのステータスを取得します。データセットの作成または更新に失敗した場合は、データセットファイルの形式を確認して、もう一度作成してください。

ファイル形式と区切り記号

Forecast では、カンマ区切り値 (CSV) ファイル形式のみがサポートされています。タブ、スペース、コロン、またはその他の文字を使用して値を区切ることはできません。

ガイドライン: データセットを CSV 形式に変換し (区切り文字としてカンマのみを使用)、ファイルのインポートを再試行します。

ファイル名

ファイル名には、アルファベットを 1 文字以上含める必要があります。名前が数値のみのファイルはインポートできません。

ガイドライン: 少なくともアルファベットが 1 文字以上含まれるように CSV データセットの名前を変更し、ファイルのインポートを再試行します。