Memilih ukuran terbaik untuk contoh replikasi - AWS Layanan Migrasi Database

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memilih ukuran terbaik untuk contoh replikasi

Memilih instans replikasi yang sesuai tergantung pada beberapa faktor kasus penggunaan Anda. Untuk membantu memahami bagaimana sumber daya instans replikasi digunakan, lihat diskusi berikut. Ini mencakup skenario umum beban penuh + tugas CDC.

Selama tugas beban penuh, AWS DMS memuat tabel satu per satu. Secara default, delapan tabel dimuat sekaligus. AWS DMS menangkap perubahan yang sedang berlangsung pada sumber selama tugas pemuatan penuh sehingga perubahan dapat diterapkan nanti pada titik akhir target. Perubahan disimpan dalam memori; jika memori yang tersedia habis, perubahan disimpan ke disk. Ketika tugas beban penuh selesai untuk tabel, AWS DMS segera terapkan perubahan cache ke tabel target.

Setelah semua perubahan ter-cache yang tertunda untuk sebuah tabel telah diterapkan, titik akhir target berada dalam keadaan konsisten secara transaksi. Pada titik ini, target sinkron dengan titik akhir sumber sehubungan dengan perubahan cache terakhir. AWS DMS kemudian mulai replikasi berkelanjutan antara sumber dan target. Untuk melakukannya, AWS DMS mengambil operasi perubahan dari log transaksi sumber dan menerapkannya ke target dengan cara yang konsisten secara transaksional. (Proses ini mengasumsikan penerapan yang dioptimalkan batch tidak dipilih). AWS DMS mengalirkan perubahan yang sedang berlangsung melalui memori pada instance replikasi, jika memungkinkan. Jika tidak, AWS DMS tulis perubahan pada disk pada instance replikasi hingga dapat diterapkan pada target.

Anda dapat mengontrol bagaimana instans replikasi menangani pemrosesan perubahan, dan bagaimana memori digunakan dalam proses tersebut. Untuk informasi lebih lanjut tentang cara mengatur pemrosesan perubahan, lihat Mengubah pengaturan penyetelan pemrosesan.

Faktor yang perlu dipertimbangkan

Memori dan ruang disk adalah faktor kunci dalam memilih contoh replikasi yang sesuai untuk kasus penggunaan Anda. Berikut ini, Anda dapat menemukan diskusi tentang karakteristik kasus penggunaan untuk menganalisis untuk memilih contoh replikasi.

  • Database dan ukuran tabel

    Volume data membantu menentukan konfigurasi tugas untuk mengoptimalkan kinerja beban penuh. Misalnya, untuk dua skema 1 TB, Anda dapat mempartisi tabel menjadi empat tugas 500 GB dan menjalankannya secara paralel. Paralelisme yang mungkin tergantung pada sumber daya CPU yang tersedia dalam contoh replikasi. Itu sebabnya ide yang baik memahami ukuran database dan tabel Anda untuk mengoptimalkan kinerja beban penuh. Ini membantu menentukan jumlah tugas yang mungkin Anda miliki.

  • Benda besar

    Tipe data yang ada dalam lingkup migrasi Anda dapat memengaruhi kinerja. Khususnya, objek besar (LOB) memengaruhi kinerja dan konsumsi memori. Untuk memigrasikan nilai LOB, AWS DMS lakukan proses dua langkah. Pertama, AWS DMS masukkan baris ke target tanpa nilai LOB. Kedua, AWS DMS memperbarui baris dengan nilai LOB. Ini berdampak pada memori, jadi penting untuk mengidentifikasi kolom LOB di sumber dan menganalisis ukurannya.

  • Frekuensi beban dan ukuran transaksi

    Frekuensi beban dan transaksi per detik (TPS) mempengaruhi penggunaan memori. Tingginya jumlah aktivitas TPS atau data manipulation language (DHTML) menyebabkan penggunaan memori yang tinggi. Ini terjadi karena DMS menyimpan perubahan sampai diterapkan ke target. Selama CDC, ini mengarah pada pertukaran (menulis ke disk fisik karena luapan memori), yang menyebabkan latensi.

  • Tombol tabel dan integritas referensial

    Informasi tentang kunci tabel menentukan mode CDC (penerapan batch atau berlaku transaksional) yang Anda gunakan untuk memigrasikan data. Secara umum, penerapan transaksional lebih lambat daripada penerapan batch. Untuk transaksi yang berjalan lama, mungkin ada banyak perubahan untuk bermigrasi. Saat Anda menggunakan aplikasi transaksional, AWS DMS mungkin memerlukan lebih banyak memori untuk menyimpan perubahan dibandingkan dengan penerapan batch. Jika Anda memigrasikan tabel tanpa kunci utama, penerapan batch akan gagal dan tugas DMS pindah ke mode penerapan transaksional. Ketika integritas referensial aktif antara tabel selama CDC, AWS DMS menggunakan penerapan transaksional secara default. Untuk informasi lebih lanjut tentang penerapan batch dibandingkan dengan penerapan transaksional, lihat Bagaimana cara menggunakan fitur penerapan batch DMS untuk meningkatkan kinerja replikasi CDC? .

Gunakan metrik ini untuk menentukan apakah Anda memerlukan instance replikasi untuk dioptimalkan komputasi atau memori dioptimalkan.

Masalah umum

Anda mungkin menghadapi masalah umum berikut yang menyebabkan pertentangan sumber daya pada instance replikasi selama migrasi. Untuk informasi tentang metrik instance replikasi, lihat. Metrik instans replikasi

  • Jika memori dalam contoh replikasi menjadi tidak mencukupi, ini menghasilkan penulisan data ke disk. Membaca dari disk dapat menyebabkan latensi, yang dapat Anda hindari dengan mengukur instance replikasi dengan memori yang cukup.

  • Ukuran disk yang ditetapkan untuk instance replikasi bisa lebih kecil dari yang dibutuhkan. Ukuran disk digunakan ketika data dalam memori tumpah; itu juga digunakan untuk menyimpan log tugas. IOPS maksimum juga tergantung padanya.

  • Menjalankan beberapa tugas atau tugas dengan paralelisme tinggi memengaruhi konsumsi CPU dari instance replikasi. Ini memperlambat pemrosesan tugas dan menghasilkan latensi.

Praktik terbaik

Pertimbangkan dua praktik terbaik yang paling umum ini saat mengukur contoh replikasi. Untuk informasi selengkapnya, lihat Praktik terbaik AWS Database Migration Service.

  1. Ukur beban kerja Anda dan pahami apakah itu padat komputer atau intensif memori. Berdasarkan ini, Anda dapat menentukan kelas dan ukuran instance replikasi:

    • AWS DMS memproses LOB dalam memori. Operasi ini membutuhkan cukup banyak memori.

    • Jumlah tugas dan jumlah thread memengaruhi konsumsi CPU. Hindari menggunakan lebih dari delapan MaxFullLoadSubTasks selama operasi beban penuh.

  2. Tingkatkan ruang disk yang ditetapkan ke instance replikasi saat Anda memiliki beban kerja yang tinggi selama beban penuh. Melakukan hal ini memungkinkan instance replikasi menggunakan IOPS maksimum yang ditetapkan untuk itu.

Pedoman sebelumnya tidak mencakup semua skenario yang mungkin. Penting untuk mempertimbangkan secara spesifik kasus penggunaan khusus Anda saat Anda menentukan ukuran instance replikasi Anda.

Tes sebelumnya menunjukkan CPU dan memori bervariasi dengan beban kerja yang berbeda. Secara khusus, LOB mempengaruhi memori, dan jumlah tugas atau paralelisme mempengaruhi CPU. Setelah migrasi Anda berjalan, pantau CPU, memori yang dapat dibebaskan, penyimpanan gratis, dan IOPS dari instance replikasi Anda. Berdasarkan data yang Anda kumpulkan, Anda dapat menambah atau mengurangi ukuran instans replikasi Anda sesuai kebutuhan.