Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Catatan penggunaan
Saat menggunakan CREATE MODEL, pertimbangkan hal berikut:
Pernyataan CREATE MODEL beroperasi dalam mode asinkron dan kembali setelah ekspor data pelatihan ke Amazon S3. Langkah-langkah pelatihan yang tersisa di Amazon SageMaker AI terjadi di latar belakang. Saat pelatihan sedang berlangsung, fungsi inferensi yang sesuai terlihat tetapi tidak dapat dijalankan. Anda dapat meminta STV_ML_ _ MODEL INFO untuk melihat status pelatihan.
Pelatihan dapat berjalan hingga 90 menit di latar belakang, secara default dalam model Otomatis dan dapat diperpanjang. Untuk membatalkan pelatihan, cukup jalankan MODEL JATUHKAN perintah.
Cluster Amazon Redshift yang Anda gunakan untuk membuat model dan bucket Amazon S3 yang digunakan untuk mementaskan data pelatihan dan artefak model harus berada di Wilayah yang sama. AWS
Selama pelatihan model, Amazon Redshift dan SageMaker AI menyimpan artefak perantara di bucket Amazon S3 yang Anda sediakan. Secara default, Amazon Redshift melakukan pengumpulan sampah di akhir operasi CREATE MODEL. Amazon Redshift menghapus objek tersebut dari Amazon S3. Untuk mempertahankan artefak tersebut di Amazon S3, setel opsi S3_GARBAGE COLLECT OFF.
Anda harus menggunakan setidaknya 500 baris dalam data pelatihan yang disediakan dalam klausa FROM.
Anda hanya dapat menentukan hingga 256 kolom fitur (input) di klausa FROM {table_name | (select_query)} saat menggunakan pernyataan CREATE MODEL.
Untuk AUTO ON, jenis kolom yang dapat Anda gunakan sebagai set pelatihan adalah SMALLINT, INTEGER, BIGINT, DECIMAL, REAL, DOUBLE, BOOLEAN, CHAR, VARCHAR, DATE, TIME, TIMETZ, TIMESTAMP, dan TIMESTAMPTZ. Untuk AUTO OFF, jenis kolom yang dapat Anda gunakan sebagai set pelatihan adalah SMALLINT, INTEGER, BIGINT, DECIMAL, REAL, DOUBLE, dan BOOLEAN.
Anda tidak dapat menggunakan DECIMAL, DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ, GEOMETRY, GEOGRAPHY, HLLSKETCH, SUPER, atau VARBYTE sebagai jenis kolom target.
Untuk meningkatkan akurasi model, lakukan salah satu hal berikut:
Tambahkan sebanyak mungkin kolom yang relevan dalam perintah CREATE MODEL saat Anda menentukan data pelatihan di klausa FROM.
Gunakan nilai yang lebih besar untuk MAX_RUNTIME dan MAX_CELLS. Nilai yang lebih besar untuk parameter ini meningkatkan biaya pelatihan model.
Eksekusi pernyataan CREATE MODEL kembali segera setelah data pelatihan dihitung dan diekspor ke bucket Amazon S3. Setelah titik itu, Anda dapat memeriksa status pelatihan menggunakan perintah SHOW MODEL. Ketika model yang dilatih di latar belakang gagal, Anda dapat memeriksa kesalahan menggunakan SHOW MODEL. Anda tidak dapat mencoba lagi model yang gagal. Gunakan DROP MODEL untuk menghapus model yang gagal dan membuat ulang model baru. Untuk informasi selengkapnya tentang SHOW MODEL, lihatMODEL PERTUNJUKAN.
BYOM lokal mendukung jenis model yang sama yang didukung Amazon Redshift MLuntuk kasus non-BYOM. Amazon Redshift mendukung polos XGBoost (menggunakan XGBoost versi 1.0 atau yang lebih baru), model KMEANS tanpa preprosesor, dan model XGBOOST/MLP/Linear Learner yang dilatih oleh Amazon AI Autopilot. SageMaker Ini mendukung yang terakhir dengan preprosesor yang ditentukan Autopilot yang juga didukung oleh Amazon AI Neo. SageMaker
Jika klaster Amazon Redshift Anda telah meningkatkan perutean yang diaktifkan untuk cloud pribadi virtual (VPC) Anda, pastikan untuk membuat titik akhir VPC Amazon S3 dan titik akhir AI VPC untuk SageMaker VPC tempat klaster Anda berada. Melakukan hal ini memungkinkan lalu lintas berjalan melalui VPC Anda di antara layanan ini selama CREATE MODEL. Untuk informasi selengkapnya, lihat SageMaker AI Clarify Job Amazon VPC Subnet dan Grup Keamanan.