Menggunakan Kumpulan Data Deret Waktu Terkait - Amazon Forecast

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan Kumpulan Data Deret Waktu Terkait

Kumpulan data deret waktu terkait mencakup data deret waktu yang tidak disertakan dalam kumpulan data deret waktu target dan dapat meningkatkan akurasi prediktor Anda.

Misalnya, dalam domain peramalan permintaan, kumpulan data deret waktu target akan berisi timestamp dan item_id dimensi, sedangkan kumpulan data deret waktu terkait pelengkap juga mencakup fitur tambahan berikut:,, dan. item price promotion weather

Kumpulan data deret waktu terkait dapat berisi hingga 10 dimensi perkiraan (yang sama dalam kumpulan data deret waktu target Anda) dan hingga 13 fitur deret waktu terkait.

Notebook Python

Untuk step-by-step panduan tentang penggunaan kumpulan data deret waktu terkait, lihat Memasukkan Deret Waktu Terkait.

catatan

Deret waktu terkait yang berisi nilai apa pun dalam cakrawala perkiraan diperlakukan sebagai deret waktu berwawasan ke depan.

Deret waktu terkait datang dalam dua bentuk:

  • Deret waktu historis: deret waktu tanpa titik data dalam cakrawala perkiraan.

  • Deret waktu berwawasan ke depan: deret waktu dengan titik data dalam cakrawala perkiraan.

Deret waktu terkait historis berisi titik data hingga cakrawala perkiraan, dan tidak mengandung titik data apa pun dalam cakrawala perkiraan. Deret waktu terkait berwawasan ke depan berisi titik data hingga dan di dalam cakrawala perkiraan.

Kumpulan data deret waktu terkait memiliki batasan berikut:

  • Itu tidak dapat menyertakan nilai target dari deret waktu target.

  • Ini harus mencakup item_id dan timestamp dimensi, dan setidaknya satu fitur terkait (sepertiprice).

  • Data fitur deret waktu terkait harus dari float tipe int atau tipe data.

  • Untuk menggunakan seluruh deret waktu target, semua item dari kumpulan data deret waktu target juga harus disertakan dalam kumpulan data deret waktu terkait. Jika deret waktu terkait hanya berisi subset item dari deret waktu target, maka pembuatan model dan pembuatan perkiraan akan terbatas pada subset item tertentu.

    Misalnya, jika deret waktu target berisi 1000 item dan kumpulan data deret waktu terkait hanya berisi 100 item, maka model dan prakiraan hanya akan didasarkan pada 100 item tersebut.

  • Frekuensi di mana data direkam dalam kumpulan data deret waktu terkait harus sesuai dengan interval di mana Anda ingin menghasilkan prakiraan (perincian peramalan).

    Misalnya, jika Anda ingin menghasilkan prakiraan pada perincian mingguan, frekuensi di mana data direkam dalam deret waktu terkait juga harus mingguan, bahkan jika frekuensi di mana data direkam dalam deret waktu target adalah harian.

  • Data untuk setiap item dalam kumpulan data deret waktu terkait harus dimulai pada atau sebelum awal timestamp yang sesuai item_id dalam kumpulan data deret waktu target.

    Misalnya, jika data deret waktu target socks dimulai pada 2019-01-01 dan data deret waktu target untuk shoes dimulai pada 2019-02-01, data deret waktu terkait untuk harus dimulai pada atau sebelum 2019-01-01 dan data untuk socks harus dimulai pada atau sebelum 2019-02-01. shoes

  • Untuk kumpulan data deret waktu terkait berwawasan ke depan, stempel waktu terakhir untuk setiap item harus berada pada stempel waktu terakhir di jendela perkiraan yang ditentukan pengguna (disebut cakrawala perkiraan).

    Dalam contoh file deret waktu terkait di bawah ini, timestamp data untuk kaus kaki dan sepatu harus berakhir pada atau setelah 2019-07-01 (stempel waktu terakhir yang direkam) ditambah cakrawala perkiraan. Jika frekuensi data dalam deret waktu target adalah harian dan cakrawala perkiraan adalah 10 hari, titik data harian harus disediakan dalam file deret waktu terkait berwawasan ke depan hingga 2019-07-11.

  • Untuk kumpulan data deret waktu terkait historis, stempel waktu terakhir untuk setiap item harus cocok dengan stempel waktu terakhir dalam deret waktu target.

    Dalam contoh file deret waktu terkait di bawah ini, timestamp data untuk kaus kaki dan sepatu harus berakhir pada 2019-07-01 (stempel waktu terakhir yang direkam).

  • Dimensi Forecast yang disediakan dalam kumpulan data deret waktu terkait harus sama dengan atau sebagian dari dimensi yang ditentukan dalam kumpulan data deret waktu target.

  • Deret waktu terkait tidak dapat memiliki nilai yang hilang. Untuk informasi tentang nilai yang hilang dalam kumpulan data deret waktu terkait, lihat Menangani Nilai yang Hilang.

Tabel berikut menunjukkan file dataset deret waktu terkait yang dikonfigurasi dengan benar. Untuk contoh ini, asumsikan yang berikut:

  • Titik data terakhir dicatat dalam dataset deret waktu target pada 2019-07-01.

  • Cakrawala prakiraan adalah 10 hari.

  • Perincian prakiraan adalah harian ()D.

Baris "" menunjukkan semua titik data di antara baris sebelumnya dan berikutnya.

timestamp item_id store price
2019-01-01 kaus kaki NYC 10
2019-01-02 kaus kaki NYC 10
2019-01-03 kaus kaki NYC 15
...
2019-06-01 kaus kaki NYC 10
...
2019-07-01 kaus kaki NYC 10
...
2019-07-11 kaus kaki NYC 20
2019-01-05 kaus kaki SFO 45
...
2019-06-05 kaus kaki SFO 10
...
2019-07-01 kaus kaki SFO 10
...
2019-07-11 kaus kaki SFO 30
2019-02-01 sepatu ORD 50
...
2019-07-01 sepatu ORD 75
...
2019-07-11 sepatu ORD 60

Tabel berikut menunjukkan frekuensi perekaman data yang kompatibel untuk deret waktu target dan deret waktu terkait untuk diramalkan pada perincian mingguan. Karena data dalam kumpulan data deret waktu terkait tidak dapat digabungkan, Forecast hanya menerima frekuensi data deret waktu terkait yang sama dengan perincian peramalan yang dipilih.

Frekuensi Data Masukan Target Frekuensi Deret Waktu Terkait Peramalan Granularitas Didukung oleh Forecast?
Harian Mingguan Mingguan Ya
Mingguan Mingguan Mingguan Ya
N/A Mingguan Mingguan Ya
Harian Harian Mingguan Tidak
catatan

Untuk memutakhirkan prediktor yang ada ke AutoPredictor, lihat Upgrade ke AutoPredictor

Saat menggunakan prediktor lama, Anda dapat menggunakan kumpulan data deret waktu terkait saat melatih prediktor dengan algoritma CNN-QR, DeepAR+, dan Prophet. NPTS, ARIMA, dan ETS tidak menerima data deret waktu terkait.

Tabel berikut menunjukkan jenis deret waktu terkait yang diterima oleh setiap algoritma Amazon Forecast.

CNN-QR DeepAR+ Nabi NPTS ARIMA ETS

Deret waktu terkait sejarah

Deret waktu terkait berwawasan ke depan

Saat menggunakan AutoML, Anda dapat memberikan data deret waktu terkait historis dan berwawasan ke depan, dan Forecast hanya akan menggunakan deret waktu tersebut jika berlaku.

Jika Anda memberikan data deret waktu terkait berwawasan ke depan, Forecast akan menggunakan data terkait dengan CNN-QR, DeepAR+, dan Prophet, dan tidak akan menggunakan data terkait dengan NPTS, ARIMA, dan ETS. Jika diberikan data deret waktu terkait historis, Forecast akan menggunakan data terkait dengan CNN-QR, dan tidak akan menggunakan data terkait dengan DeepAR+, Prophet, NPTS, ARIMA, dan ETS.