Kami tidak lagi memperbarui layanan Amazon Machine Learning atau menerima pengguna baru untuk itu. Dokumentasi ini tersedia untuk pengguna yang sudah ada, tetapi kami tidak lagi memperbaruinya. Untuk informasi selengkapnya, lihat Apa itu Amazon Machine Learning.
Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan Data dari Database Amazon RDS untuk Membuat Sumber Data Amazon Amazon
Amazon ML memungkinkan Anda membuat objek sumber data dari data yang disimpan dalam database MySQL di Amazon Relational Database Service (Amazon RDS). Saat Anda melakukan tindakan ini, Amazon MLmembuat objek AWS Data Pipeline yang mengeksekusi kueri SQL yang Anda tentukan, dan menempatkan output ke dalam bucket S3 pilihan Anda. Amazon ML menggunakan data tersebut untuk membuat sumber data.
catatan
Amazon ML hanya mendukung database MySQL di. VPCs
Sebelum Amazon ML dapat membaca data input Anda, Anda harus mengekspor data tersebut ke Amazon Simple Storage Service (Amazon S3). Anda dapat mengatur Amazon ML untuk melakukan ekspor untuk Anda dengan menggunakan API. (RDS terbatas pada API, dan tidak tersedia dari konsol.)
Agar Amazon ML dapat terhubung ke database MySQL Anda di Amazon RDS dan membaca data atas nama Anda, Anda harus memberikan yang berikut:
-
Pengidentifikasi instans RDS DB
-
Nama database MySQL
-
Peran AWS Identity and Access Management (IAM) yang digunakan untuk membuat, mengaktifkan, dan menjalankan pipa data
-
Kredensi pengguna database:
-
Nama pengguna
-
Kata sandi
-
-
Informasi keamanan AWS Data Pipeline:
-
Peran sumber daya IAM
-
Peran layanan IAM
-
-
Informasi keamanan Amazon RDS:
-
ID subnet.
-
Kelompok keamanan IDs
-
-
Kueri SQL yang menentukan data yang ingin Anda gunakan untuk membuat sumber data
-
Lokasi keluaran S3 (bucket) digunakan untuk menyimpan hasil kueri
-
(Opsional) Lokasi file skema data
Selain itu, Anda perlu memastikan bahwa pengguna IAM atau peran yang membuat sumber data Amazon RDS dengan menggunakan operasi CreateDataSourceFromRDS memiliki izin. iam:PassRole
Untuk informasi selengkapnya, lihat Mengontrol Akses ke Sumber Daya Amazon ML-dengan IAM.
Topik
Pengidentifikasi Instans Database RDS
Pengidentifikasi instans RDS DB adalah nama unik yang Anda berikan yang mengidentifikasi instance database yang harus digunakan Amazon ML saat berinteraksi dengan Amazon RDS. Anda dapat menemukan pengenal instans RDS DB di konsol Amazon RDS.
Nama Database MySQL
MySQL Database Name menentukan nama database MySQL dalam contoh RDS DB.
Kredensial Pengguna Database
Untuk terhubung ke instans RDS DB, Anda harus menyediakan nama pengguna dan kata sandi pengguna database yang memiliki izin yang cukup untuk menjalankan kueri SQL yang Anda berikan.
Informasi Keamanan AWS Data Pipeline
Untuk mengaktifkan akses AWS Data Pipeline yang aman, Anda harus memberikan nama peran sumber daya IAM dan peran layanan IAM.
EC2 Instance mengasumsikan peran sumber daya untuk menyalin data dari Amazon RDS ke Amazon S3. Cara termudah untuk membuat peran sumber daya ini adalah dengan menggunakan DataPipelineDefaultResourceRole
templat, dan daftar machinelearning.aws.com
sebagai layanan tepercaya. Untuk informasi selengkapnya tentang template, lihat Menyiapkan peran IAM di Panduan Pengembang AWS Data Pipeline.
Jika Anda membuat peran Anda sendiri, itu harus memiliki konten berikut:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": "machinelearning.amazonaws.com" }, "Action": "sts:AssumeRole", "Condition": { "StringEquals": { "aws:SourceAccount": "
123456789012
" }, "ArnLike": { "aws:SourceArn": "arn:aws:machinelearning:us-east-1:123456789012
:datasource/*" } } }] }
AWS Data Pipeline mengasumsikan peran layanan untuk memantau kemajuan penyalinan data dari Amazon RDS ke Amazon S3. Cara termudah untuk membuat peran sumber daya ini adalah dengan menggunakan DataPipelineDefaultRole
templat, dan daftar machinelearning.aws.com
sebagai layanan tepercaya. Untuk informasi selengkapnya tentang template, lihat Menyiapkan peran IAM di Panduan Pengembang AWS Data Pipeline.
Informasi Keamanan Amazon RDS
Untuk mengaktifkan akses Amazon RDS yang aman, Anda perlu menyediakan VPC Subnet ID
danRDS Security Group IDs
. Anda juga perlu mengatur aturan masuk yang sesuai untuk subnet VPC yang ditunjukkan oleh Subnet ID
parameter, dan memberikan ID grup keamanan yang memiliki izin ini.
Kueri MySQL SQL
MySQL SQL Query
Parameter menentukan query SQL SELECT yang ingin Anda jalankan pada database MySQL Anda. Hasil kueri disalin ke lokasi keluaran S3 (bucket) yang Anda tentukan.
catatan
Teknologi pembelajaran mesin bekerja paling baik ketika catatan masukan disajikan dalam urutan acak (dikocokkan). Anda dapat dengan mudah mengacak hasil kueri MySQL SQL Anda dengan menggunakan fungsi. rand()
Misalnya, katakanlah ini adalah kueri asli:
“PILIH col1, col2,... DARI training_table”
Anda dapat menambahkan pengocokan acak dengan memperbarui kueri seperti ini:
“PILIH col1, col2,... DARI training_table PESANAN OLEH rand ()”
Lokasi Output S3
S3 Output Location
Parameter menentukan nama lokasi “pementasan” Amazon S3 di mana hasil kueri MySQL SQL adalah output.
catatan
Anda perlu memastikan bahwa Amazon ML memiliki izin untuk membaca data dari lokasi ini setelah data diekspor dari Amazon RDS. Untuk informasi tentang menyetel izin ini, lihat Memberikan Izin Amazon MLL untuk Membaca Data Anda dari Amazon S3.