Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pembelajaran mesin untuk pemula dan ahli
Dengan Amazon Redshift, Anda dapat memanfaatkan kemampuan Machine Learning (ML) untuk mendapatkan wawasan dari data Anda, baik Anda pemula maupun ahli di bidang ML. Machine Learning adalah fitur Amazon Redshift yang memungkinkan Anda membuat, melatih, dan menerapkan model ML menggunakan SQL perintah, tanpa memerlukan keahlian ML yang ekstensif atau rekayasa data yang kompleks.
Bagian berikut memandu Anda melalui proses pemanfaatan Machine Learning, memberdayakan Anda untuk membuka potensi penuh data Anda dengan Amazon Redshift.
Amazon Redshift ML memungkinkan Anda melatih model dengan satu perintah tunggal SQL CREATEMODEL. CREATEMODELPerintah tersebut membuat model yang digunakan Amazon Redshift untuk menghasilkan prediksi berbasis model dengan konstruksi yang sudah dikenal. SQL
Amazon Redshift ML sangat berguna jika Anda tidak memiliki keahlian dalam pembelajaran mesin, alat, bahasa, algoritme, dan. APIs Dengan Amazon Redshift ML, Anda tidak perlu melakukan pengangkatan berat tanpa diferensiasi yang diperlukan untuk berintegrasi dengan layanan pembelajaran mesin eksternal. Amazon Redshift menghemat waktu Anda untuk memformat dan memindahkan data, mengelola kontrol izin, atau membuat integrasi, alur kerja, dan skrip khusus. Anda dapat dengan mudah menggunakan algoritme pembelajaran mesin populer dan menyederhanakan kebutuhan pelatihan yang memerlukan iterasi sering dari pelatihan hingga prediksi. Amazon Redshift secara otomatis menemukan algoritma terbaik dan menyetel model terbaik untuk masalah Anda. Anda dapat membuat prediksi dari dalam cluster Amazon Redshift tanpa perlu memindahkan data dari Amazon Redshift atau berinteraksi dengan dan membayar layanan lain.
Amazon Redshift ML mendukung analis data dan ilmuwan data dalam menggunakan pembelajaran mesin. Hal ini juga memungkinkan para ahli pembelajaran mesin untuk menggunakan pengetahuan mereka untuk memandu CREATE MODEL pernyataan untuk hanya menggunakan aspek-aspek yang mereka tentukan. Dengan demikian, Anda dapat mempercepat waktu yang CREATE MODEL dibutuhkan untuk menemukan kandidat terbaik, meningkatkan akurasi model, atau keduanya.
CREATEMODELPernyataan tersebut menawarkan fleksibilitas dalam bagaimana Anda dapat menentukan parameter untuk pekerjaan pelatihan. Dengan menggunakan fleksibilitas ini, baik pemula atau ahli pembelajaran mesin dapat memilih preprosesor, algoritma, jenis masalah, dan hiperparameter pilihan mereka. Misalnya, pengguna yang tertarik dengan churn pelanggan mungkin menentukan untuk CREATE MODEL pernyataan bahwa jenis masalah adalah klasifikasi biner, yang bekerja dengan baik untuk churn pelanggan. Kemudian CREATE MODEL pernyataan tersebut mempersempit pencariannya untuk model terbaik menjadi model klasifikasi biner. Bahkan dengan pilihan pengguna dari jenis masalah, masih ada banyak opsi yang dapat digunakan oleh CREATE MODEL pernyataan tersebut. Misalnya, CREATE MODEL menemukan dan menerapkan transformasi preprocessing terbaik dan menemukan pengaturan hyperparameter terbaik.
Amazon Redshift MLmempermudah pelatihan dengan secara otomatis menemukan model terbaik menggunakan Amazon SageMaker Autopilot. Di balik layar, Amazon SageMaker Autopilot secara otomatis melatih dan menyetel model pembelajaran mesin terbaik berdasarkan data yang Anda berikan. Amazon SageMaker Neo kemudian mengkompilasi model pelatihan dan membuatnya tersedia untuk prediksi di cluster Redshift Anda. Saat Anda menjalankan kueri inferensi pembelajaran mesin menggunakan model terlatih, kueri dapat menggunakan kemampuan pemrosesan paralel besar-besaran Amazon Redshift. Pada saat yang sama, kueri dapat menggunakan prediksi berbasis pembelajaran mesin.
-
Sebagai pemula pembelajaran mesin, dengan pengetahuan umum tentang berbagai aspek pembelajaran mesin seperti preprosesor, algoritma, dan hiperparameter, gunakan CREATE MODEL pernyataan hanya untuk aspek yang Anda tentukan. Kemudian Anda dapat mempersingkat waktu yang CREATE MODEL diperlukan untuk menemukan kandidat terbaik atau meningkatkan akurasi model. Selain itu, Anda dapat meningkatkan nilai bisnis prediksi dengan memperkenalkan pengetahuan domain tambahan seperti jenis masalah atau tujuan. Misalnya, dalam skenario churn pelanggan, jika hasil “pelanggan tidak aktif” jarang terjadi, maka tujuan F1 sering lebih disukai daripada tujuan Akurasi. Karena model Akurasi tinggi mungkin memprediksi “pelanggan aktif” sepanjang waktu, ini menghasilkan akurasi tinggi tetapi nilai bisnis kecil. Untuk informasi tentang tujuan F1, lihat utoMLJobTujuan dalam SageMaker APIReferensi Amazon.
Untuk informasi selengkapnya tentang opsi dasar untuk CREATE MODEL pernyataan, lihatSederhana CREATE MODEL.
-
Sebagai praktisi tingkat lanjut pembelajaran mesin, Anda dapat menentukan jenis masalah dan preprosesor untuk fitur tertentu (tetapi tidak semua). Kemudian CREATE MODEL ikuti saran Anda tentang aspek yang ditentukan. Pada saat yang sama, CREATE MODEL masih menemukan preprocessors terbaik untuk fitur yang tersisa dan hyperparameter terbaik. Untuk informasi selengkapnya tentang bagaimana Anda dapat membatasi satu atau lebih aspek dari jalur pelatihan, lihatCREATEMODELdengan panduan pengguna.
-
Sebagai ahli pembelajaran mesin, Anda dapat mengendalikan sepenuhnya pelatihan dan penyetelan hyperparameter. Kemudian CREATE MODEL pernyataan tersebut tidak mencoba untuk menemukan preprocessors, algoritma, dan hyperparameters yang optimal karena Anda membuat semua pilihan. Untuk informasi selengkapnya tentang cara menggunakan CREATE MODEL dengan AUTOOFF, lihatCREATEXGBoostmodel dengan AUTO OFF.
-
Sebagai insinyur data, Anda dapat membawa XGBoost model yang telah dilatih sebelumnya di Amazon SageMaker dan mengimpornya ke Amazon Redshift untuk inferensi lokal. Dengan bring your own model (BYOM), Anda dapat menggunakan model yang dilatih di luar Amazon Redshift dengan Amazon SageMaker untuk inferensi dalam database secara lokal di Amazon Redshift. Amazon Redshift MLmendukung penggunaan inferensi BYOM lokal atau jarak jauh.
Untuk informasi selengkapnya tentang cara menggunakan CREATE MODEL pernyataan untuk inferensi lokal atau jarak jauh, lihatBawa model Anda sendiri (BYOM) - inferensi lokal.
Sebagai pengguna Amazon Redshift MS, Anda dapat memilih salah satu opsi berikut untuk melatih dan menerapkan model Anda:
-
Jenis masalah, lihatCREATEMODELdengan panduan pengguna.
-
Tujuan, lihat CREATEMODELdengan panduan pengguna atauCREATEXGBoostmodel dengan AUTO OFF.
-
Jenis model, lihatCREATEXGBoostmodel dengan AUTO OFF.
-
Preprosesor, lihatCREATEMODELdengan panduan pengguna.
-
Hyperparameter, lihatCREATEXGBoostmodel dengan AUTO OFF.
-
Bawa model Anda sendiri (BYOM), lihatBawa model Anda sendiri (BYOM) - inferensi lokal.