Ec2Resource - AWS Data Pipeline

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Ec2Resource

Instans Amazon EC2 yang melakukan pekerjaan yang ditentukan oleh aktivitas alur.

AWS Data Pipeline sekarang mendukung IMDSv2 untuk instans Amazon EC2, yang menggunakan metode berorientasi sesi untuk menangani otentikasi dengan lebih baik saat mengambil informasi metadata dari instance. Sesi dimulai dan mengakhiri serangkaian permintaan yang digunakan perangkat lunak yang berjalan pada instans Amazon EC2 untuk mengakses metadata dan kredenal instans Amazon EC2 yang disimpan secara lokal. Perangkat lunak memulai sesi dengan permintaan HTTP PUT sederhana ke IMDSv2. ImDSv2 mengembalikan token rahasia ke perangkat lunak yang berjalan pada instans Amazon EC2, yang akan menggunakan token sebagai kata sandi untuk membuat permintaan ke IMDSv2 untuk metadata dan kredensi.

catatan

Untuk menggunakan IMDSv2 untuk instans Amazon EC2 Anda, Anda perlu mengubah pengaturan, karena AMI default tidak kompatibel dengan IMDSv2. Anda dapat menentukan versi AMI baru yang dapat Anda ambil melalui parameter SSM berikut:. /aws/service/ami-amazon-linux-latest/amzn-ami-hvm-x86_64-ebs

Untuk informasi tentang instans Amazon EC2 default yang AWS Data Pipeline dibuat jika Anda tidak menentukan instance, lihat. Instans Amazon EC2 Default oleh Wilayah AWS

Contoh

EC2-Klasik

penting

Hanya AWS akun yang dibuat sebelum 4 Desember 2013 yang mendukung platform EC2-Classic. Jika Anda memiliki salah satu akun ini, Anda mungkin memiliki pilihan untuk membuat objek EC2Resource untuk alur di jaringan EC2-Classic daripada VPC. Kami sangat merekomendasikan agar Anda membuat sumber daya untuk semua alur Anda di VPC. Selain itu, jika Anda memiliki sumber daya yang ada di EC2-Classic, kami sarankan Anda memigrasikannya ke VPC.

Contoh objek berikut meluncurkan instans EC2 ke EC2-Classic, dengan beberapa bidang opsional ditetapkan.

{ "id" : "MyEC2Resource", "type" : "Ec2Resource", "actionOnTaskFailure" : "terminate", "actionOnResourceFailure" : "retryAll", "maximumRetries" : "1", "instanceType" : "m5.large", "securityGroups" : [ "test-group", "default" ], "keyPair" : "my-key-pair" }

EC2-VPC

Contoh objek berikut meluncurkan instans EC2 menjadi VPC nondefault dengan beberapa bidang opsional ditetapkan.

{ "id" : "MyEC2Resource", "type" : "Ec2Resource", "actionOnTaskFailure" : "terminate", "actionOnResourceFailure" : "retryAll", "maximumRetries" : "1", "instanceType" : "m5.large", "securityGroupIds" : [ "sg-12345678", "sg-12345678" ], "subnetId": "subnet-12345678", "associatePublicIpAddress": "true", "keyPair" : "my-key-pair" }

Sintaks

Bidang yang Wajib Diisi Deskripsi Jenis Slot
resourceRole IAM role yang mengontrol sumber daya yang instans Amazon EC2 dapat mengakses. String
peran Peran IAM yang AWS Data Pipeline digunakan untuk membuat instans EC2. String

Bidang Invokasi Objek Deskripsi Jenis Slot
jadwal

Objek ini dipanggil dalam pelaksanaan interval jadwal.

Untuk mengatur urutan eksekusi dependensi untuk objek ini, tentukan referensi jadwal ke objek lain. Anda dapat melakukannya dengan salah satu cara berikut:

  • Untuk memastikan bahwa semua objek dalam alur mewarisi jadwal, atur jadwal pada objek secara eksplisit: "schedule": {"ref": "DefaultSchedule"}. Dalam kebanyakan kasus, lebih baik untuk menempatkan referensi jadwal pada objek alur default sehingga semua objek mewarisi jadwal itu.

  • Jika alur memiliki pohon jadwal yang bersarang di jadwal utama, Anda dapat membuat objek induk yang memiliki referensi jadwal. Untuk informasi selengkapnya tentang konfigurasi jadwal opsional contoh, lihat https://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-object-schedule.html

Objek Referensi, misalnya "schedule":{"ref":"myScheduleId"}

Bidang Opsional Deskripsi Jenis Slot
actionOnResourceKegagalan Tindakan yang diambil setelah kegagalan sumber daya untuk sumber daya ini. Nilai yang valid adalah "retryall" dan "retrynone". String
actionOnTaskKegagalan Tindakan yang diambil setelah kegagalan tugas untuk sumber daya ini. Nilai-nilai yang valid adalah "continue" atau "terminate". String
associatePublicIpAlamat Menunjukkan apakah akan menetapkan alamat IP publik pada instans. Jika instans adalah di Amazon EC2 atau Amazon VPC, nilai defaultnya adalah true. Jika tidak, nilai defaultnya adalah false. Boolean
attemptStatus Baru-baru ini melaporkan status dari aktivitas jarak jauh. String
attemptTimeout Timeout untuk penyelesaian pekerjaan jarak jauh. Jika disetel, maka aktivitas jarak jauh yang tidak lengkap dalam waktu mulai yang ditetapkan mungkin dicoba lagi. Periode
availabilityZone Availability Zone tempat meluncurkan instans Amazon EC2. String
NonaktifkanIMDSv1 Nilai default adalah false dan memungkinkan IMDSv1 dan IMDSv2. Jika Anda menyetelnya ke true maka itu menonaktifkan IMDSv1 dan hanya menyediakan IMDSv2s Boolean
failureAndRerunModus Menjelaskan perilaku simpul konsumen ketika dependensi gagal atau menjalankan kembali. Pencacahan
httpProxy Host proxy yang digunakan klien untuk terhubung ke AWS layanan. Objek Referensi, misalnya, "httpProxy":{"ref":"myHttpProxyId"}
imageId

ID AMI yang digunakan untuk digunakan untuk instans. Secara default, AWS Data Pipeline menggunakan tipe virtualisasi HVM AMI. ID AMI spesifik yang digunakan didasarkan pada Wilayah. Anda dapat menimpa AMI default dengan menentukan AMI HVM pilihan Anda. Untuk informasi selengkapnya tentang tipe AMI, lihat Jenis Virtualisasi AMI Linux dan Menemukan AMI Linux di Panduan Pengguna Amazon EC2.

String
initTimeout Jumlah waktu untuk menunggu sumber daya dimulai. Periode
instanceCount Telah usang. Bilangan Bulat
instanceType Jenis instans Amazon EC2 untuk dimulai. String
keyPair Nama pasangan kunci. Jika Anda meluncurkan instans Amazon EC2 tanpa menentukan pasangan kunci, Anda tidak dapat masuk ke sana. String
lateAfterTimeout Waktu berlalu setelah alur mulai di mana objek harus menyelesaikan. Hal ini dipicu hanya ketika jenis jadwal tidak disetel ke ondemand. Periode
maxActiveInstances Jumlah maksimum instans aktif bersamaan dari suatu komponen. Re-runs tidak dihitung terhadap jumlah instans aktif. Bilangan Bulat
maximumRetries Jumlah maksimum upaya mencoba ulang pada kegagalan. Bilangan Bulat
minInstanceCount Telah usang. Bilangan Bulat
onFail Tindakan untuk dijalankan ketika objek saat ini gagal. Objek Referensi, misalnya "onFail":{"ref":"myActionId"}
onLateAction Tindakan yang harus dipicu jika objek belum dijadwalkan atau masih berjalan. Objek Referensi, misalnya"onLateAction":{"ref":"myActionId"}
onSuccess Tindakan untuk dijalankan ketika objek saat ini berhasil. Objek Referensi, misalnya, "onSuccess":{"ref":"myActionId"}
induk Induk dari objek saat ini dari mana slot diwariskan. Objek Referensi, misalnya, "parent":{"ref":"myBaseObjectId"}
pipelineLogUri Amazon S3 URI (seperti 's3://BucketName/Key/') untuk mengunggah log untuk alur. String
region Kode untuk Wilayah di mana instans Amazon EC2 harus berjalan. Secara default, instans berjalan di Wilayah yang sama dengan alur. Anda dapat menjalankan instans di Wilayah yang sama sebagai set data bergantung. Pencacahan
reportProgressTimeout Timeout untuk panggilan kerja jarak jauh berturut-turut ke reportProgress. Jika disetel, maka aktivitas jarak jauh yang tidak melaporkan kemajuan untuk jangka waktu tertentu dapat dianggap terhenti dan akan dicoba lagi. Periode
retryDelay Durasi timeout antara dua upaya coba lagi. Periode
runAsUser Pengguna untuk menjalankan TaskRunner. String
runsOn Bidang ini tidak diizinkan pada objek ini. Objek Referensi, misalnya, "runsOn":{"ref":"myResourceId"}
scheduleType

Jenis jadwal mengizinkan Anda untuk menentukan apakah objek dalam definisi alur Anda harus dijadwalkan pada awal interval, atau akhir interval, atau sesuai permintaan.

Nilainya adalah:

  • timeseries. Instans dijadwalkan pada akhir setiap interval.

  • cron. Instans dijadwalkan pada awal setiap interval.

  • ondemand. Mengizinkan Anda untuk menjalankan alur satu kali per aktivasi. Anda tidak perlu meng-klon atau membuat ulang alur untuk menjalankannya lagi. Jika Anda menggunakan jadwal sesuai permintaan, itu harus ditentukan dalam objek default dan harus menjadi satu-satunya scheduleType yang ditentukan untuk objek dalam alur. Untuk menggunakan alur sesuai permintaan, panggil operasi ActivatePipeline untuk setiap putaran berikutnya.

Pencacahan
securityGroupIds ID dari satu atau lebih grup keamanan Amazon EC2 untuk digunakan untuk instans di kolam sumber daya. String
securityGroups Satu atau lebih grup keamanan Amazon EC2 untuk digunakan untuk instans di kolam sumber daya. String
spotBidPrice Jumlah maksimum per jam untuk Instans Spot Anda dalam dolar, yang merupakan nilai desimal antara 0 dan 20,00, eksklusif. String
subnetId ID subnet Amazon EC2 tempat memulai instans. String
terminateAfter Jumlah jam setelah itu untuk mengakhiri sumber daya. Periode
useOnDemandOnLastAttempt Pada upaya terakhir untuk meminta Instans Spot, buat permintaan untuk Instans Sesuai Permintaan daripada Instans Spot. Hal ini memastikan bahwa jika semua upaya sebelumnya telah gagal, upaya terakhir tidak terganggu. Boolean
workerGroup Bidang ini tidak diizinkan pada objek ini. String

Bidang Runtime Deskripsi Jenis Slot
@activeInstances Daftar objek instans aktif terjadwal saat ini. Objek Referensi, misalnya, "activeInstances":{"ref":"myRunnableObjectId"}
@actualEndTime Waktu ketika eksekusi objek ini selesai. DateTime
@actualStartTime Waktu ketika eksekusi objek ini dimulai. DateTime
cancellationReason cancellationReason jika objek ini dibatalkan. String
@cascadeFailedOn Deskripsi rantai dependensi tempat objek gagal. Objek Referensi, misalnya, "cascadeFailedOn":{"ref":"myRunnableObjectId"}
emrStepLog Log langkah tersedia hanya pada upaya aktivitas Amazon EMR. String
errorId ID kesalahan jika objek ini gagal. String
errorMessage Pesan galat jika objek ini gagal. String
errorStackTrace Jejak tumpukan kesalahan jika objek ini gagal. String
@failureReason Alasan kegagalan sumber daya. String
@finishedTime Waktu saat objek ini menyelesaikan eksekusinya. DateTime
hadoopJobLog Log tugas Hadoop yang tersedia pada upaya untuk aktivitas Amazon EMR. String
@healthStatus Status kondisi objek yang mencerminkan keberhasilan atau kegagalan instans objek terakhir yang mencapai keadaan dihentikan. String
@healthStatusFromInstanceId Id dari objek instans terakhir yang mencapai keadaan dihentikan. String
@ healthStatusUpdated Waktu Waktu di mana status kondisi diperbarui terakhir kali. DateTime
hostname Nama host klien yang mengambil upaya tugas. String
@lastDeactivatedTime Waktu di mana objek ini terakhir dinonaktifkan. DateTime
@ latestCompletedRun Waktu Waktu proses terakhir yang eksekusinya selesai. DateTime
@latestRunTime Waktu proses terakhir untuk eksekusi yang dijadwalkan. DateTime
@nextRunTime Waktu run yang akan dijadwalkan berikutnya. DateTime
reportProgressTime Waktu terbaru aktivitas jarak jauh melaporkan kemajuan. DateTime
@scheduledEndTime Jadwal waktu akhir untuk objek. DateTime
@scheduledStartTime Jadwal waktu mulai untuk objek. DateTime
@status Status objek ini. String
@version Versi alur dengan objek yang dibuat. String
@waitingOn Deskripsi daftar dependensi yang menunggu objek ini. Objek Referensi, misalnya, "waitingOn":{"ref":"myRunnableObjectId"}

Bidang Sistem Deskripsi Jenis Slot
@error Galat menggambarkan objek yang tidak terbentuk. String
@pipelineId ID dari alur tempat objek ini berada. String
@sphere Tempat objek dalam siklus hidup. objek komponen memunculkan objek instans, yang mengeksekusi objek percobaan. String