Pedoman Dataset untuk Forecast - Amazon Forecast

Amazon Forecast tidak lagi tersedia untuk pelanggan baru. Pelanggan Amazon Forecast yang ada dapat terus menggunakan layanan seperti biasa. Pelajari lebih lanjut”

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pedoman Dataset untuk Forecast

Lihat panduan berikut jika Amazon Forecast gagal mengimpor kumpulan data Anda, atau jika kumpulan data Anda tidak berfungsi seperti yang diharapkan.

Format Stempel Waktu

Untuk frekuensi pengumpulan Year (YM), Month (W), Week (), dan Day (D), Forecast mendukung format yyyy-MM-dd stempel waktu (misalnya,2019-08-21) dan, secara opsional, HH:mm:ss formatnya (misalnya,). 2019-08-21 15:00:00

Untuk frekuensi Hour (H) dan Minute (M), Forecast hanya mendukung yyyy-MM-dd HH:mm:ss format (misalnya2019-08-21 15:00:00).

Pedoman: Ubah format stempel waktu untuk frekuensi pengumpulan kumpulan data Anda ke format yang didukung.

File atau Bucket Amazon S3

Saat mengimpor kumpulan data, Anda dapat menentukan jalur ke file Parket CSV atau Parket di bucket Amazon Simple Storage Service (Amazon S3) yang berisi data atau nama bucket S3 yang berisi data Anda. Jika Anda menentukan file CSV atau Parquet, Forecast hanya mengimpor file itu. Jika Anda menentukan bucket S3, Forecast mengimpor semua file CSV atau Parquet dalam bucket hingga 10.000 file. Jika Anda mengimpor beberapa file dengan menentukan nama bucket, semua CSV atau file Parket harus sesuai dengan skema yang ditentukan.

Pedoman: Tentukan file tertentu atau bucket S3 menggunakan sintaks berikut:

s3://bucket-name/example-object.csv

s3://bucket-name/example-object.parquet

s3://bucket-name/prefix/

s3://bucket-name

File parket dapat memiliki ekstensi.parquet, .parq, .pqt, atau tidak ada ekstensi sama sekali.

Pembaruan Dataset Lengkap

Impor kumpulan data pertama Anda selalu merupakan impor penuh, impor berikutnya dapat berupa pembaruan penuh atau tambahan. Anda harus menggunakan Forecast API untuk menentukan mode impor.

Dengan pembaruan penuh, semua data yang ada diganti dengan data yang baru diimpor. Karena pekerjaan impor dataset lengkap tidak digabungkan, impor dataset terbaru Anda adalah yang digunakan saat melatih prediktor atau menghasilkan perkiraan.

Pedoman: Buat pembaruan kumpulan data tambahan untuk menambahkan data baru Anda ke data yang ada. Jika tidak, pastikan bahwa impor dataset terbaru Anda berisi semua data yang ingin Anda modelkan, dan bukan hanya data baru yang dikumpulkan sejak impor sebelumnya.

Pembaruan Dataset Tambahan

Bidang seperti stempel waktu, format data, geolokasi, dll dibaca dari kumpulan data yang sedang aktif. Anda tidak perlu menyertakan informasi ini dengan impor dataset tambahan. Jika disertakan, mereka harus cocok dengan nilai yang diberikan semula.

Pedoman: Lakukan impor dataset lengkap untuk mengubah salah satu nilai ini.

Urutan Atribut

Urutan atribut yang ditentukan dalam definisi skema harus sesuai dengan urutan kolom dalam file CSV atau Parket yang Anda impor. Misalnya, jika Anda didefinisikan timestamp sebagai atribut pertama, maka juga timestamp harus menjadi kolom pertama dalam file input.

Pedoman: Verifikasi bahwa kolom dalam file input berada dalam urutan yang sama dengan atribut skema yang Anda buat.

Indeks Cuaca

Untuk menerapkan Indeks Cuaca, Anda harus menyertakan atribut geolokasi dalam deret waktu target Anda dan kumpulan data deret waktu terkait. Anda juga perlu menentukan zona waktu untuk stempel waktu deret waktu target Anda.

Pedoman: Pastikan kumpulan data Anda menyertakan atribut geolokasi dan stempel waktu Anda memiliki zona waktu yang ditetapkan. Untuk informasi selengkapnya, lihat Kondisi dan Pembatasan Indeks Cuaca.

Header Dataset

Header dataset di input Anda CSV dapat menyebabkan kesalahan validasi. Kami merekomendasikan untuk menghilangkan header untuk CSV file.

Pedoman: Hapus header dataset dan coba impor lagi.

Header dataset diperlukan untuk file Parket.

Status Dataset

Sebelum Anda dapat mengimpor data pelatihan dengan CreateDatasetImportJob operasi, dataset harusACTIVE. Status

Pedoman: Gunakan DescribeDataset operasi untuk mendapatkan status kumpulan data. Jika pembuatan atau pembaruan kumpulan data gagal, periksa pemformatan file kumpulan data Anda dan coba buat lagi.

Format File Default

Format file defaultnya adalahCSV.

Format File dan Pembatas

Forecast hanya mendukung format file values (CSV) yang dipisahkan koma dan format Parket. Anda tidak dapat memisahkan nilai menggunakan tab, spasi, titik dua, atau karakter lainnya.

Pedoman: Konversikan kumpulan data Anda ke CSV format (hanya menggunakan koma sebagai pembatas Anda) atau format Parket dan coba impor file lagi.

Nama berkas

Nama file harus mengandung setidaknya satu karakter alfabet. File dengan nama yang hanya numerik tidak dapat diimpor.

Pedoman: Ganti nama file data input Anda untuk menyertakan setidaknya satu karakter alfabet dan coba impor file lagi.

Data Parket yang Dipartisi

Forecast tidak membaca file Parket yang dipartisi.

Persyaratan Dataset Analisis bagaimana-jika

Analisis bagaimana-jika memerlukan kumpulan data. CSV TimeSeriesSelector Pengoperasian CreateWhatIfAnalysis tindakan dan TimeSeriesReplacementDataSource pengoperasian file parket CreateWhatIfForecast tidak menerima.