Migrasi data antara domain dan koleksi menggunakan Amazon Ingestion OpenSearch - OpenSearch Layanan Amazon

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Migrasi data antara domain dan koleksi menggunakan Amazon Ingestion OpenSearch

Anda dapat menggunakan pipeline OpenSearch Ingestion untuk memigrasikan data antara domain OpenSearch Layanan Amazon atau OpenSearch koleksi VPC Tanpa Server. Untuk melakukannya, Anda menyiapkan pipeline tempat Anda mengonfigurasi satu domain atau koleksi sebagai sumber, dan domain atau koleksi lain sebagai wastafel. Ini secara efektif memigrasikan data Anda dari satu domain atau koleksi ke domain lainnya.

Untuk memigrasikan data, Anda harus memiliki sumber daya berikut:

  • Domain OpenSearch layanan sumber atau koleksi OpenSearch VPC Tanpa Server. Domain atau koleksi ini berisi data yang ingin Anda migrasikan. Jika Anda menggunakan domain, domain tersebut harus menjalankan OpenSearch versi 1.0 atau yang lebih baru, atau Elasticsearch versi 7.4 atau yang lebih baru. Domain juga harus memiliki kebijakan akses yang memberikan izin yang sesuai untuk peran pipeline Anda.

  • Domain terpisah atau koleksi VPC tempat Anda ingin memigrasikan data Anda. Domain atau koleksi ini akan bertindak sebagai sink pipa.

  • Peran pipeline yang akan digunakan OpenSearch Ingestion untuk membaca dan menulis ke koleksi atau domain Anda. Anda menyertakan Nama Sumber Daya Amazon (ARN) peran ini dalam konfigurasi pipeline Anda. Untuk informasi selengkapnya, lihat sumber daya berikut:

Batasan

Batasan berikut berlaku saat Anda menetapkan domain OpenSearch Layanan atau koleksi OpenSearch Tanpa Server sebagai sink:

  • Pipeline tidak dapat menulis ke lebih dari satu domain VPC.

  • Anda hanya dapat memigrasikan data ke atau dari koleksi OpenSearch Tanpa Server yang menggunakan akses VPC. Koleksi publik tidak didukung.

  • Anda tidak dapat menentukan kombinasi VPC dan domain publik dalam satu konfigurasi pipeline.

  • Anda dapat memiliki maksimum 20 sink non-pipa dalam satu konfigurasi pipa.

  • Anda dapat menentukan sink dari maksimum tiga yang berbeda Wilayah AWS dalam satu konfigurasi pipa.

  • Pipeline dengan beberapa sink mungkin mengalami pengurangan kecepatan pemrosesan dari waktu ke waktu jika salah satu sink mati terlalu lama, atau tidak disediakan dengan kapasitas yang cukup untuk menerima data yang masuk.

OpenSearch Layanan sebagai sumber

Domain atau koleksi yang Anda tentukan sebagai sumber adalah tempat data dimigrasi.

Membuat peran pipeline di IAM

Untuk membuat pipeline OpenSearch Ingestion, Anda harus terlebih dahulu membuat peran pipeline untuk memberikan akses baca dan tulis antara domain atau koleksi. Untuk melakukan ini, lakukan langkah-langkah berikut:

  1. Buat kebijakan izin baru di IAM untuk dilampirkan ke peran pipeline. Pastikan Anda mengizinkan izin untuk membaca dari sumber dan menulis ke wastafel. Untuk informasi selengkapnya tentang menyetel izin pipeline IAM untuk domain OpenSearch Layanan, lihat dan. Memberikan akses saluran pipa Amazon OpenSearch Ingestion ke domain Memberikan akses saluran pipa Amazon OpenSearch Ingestion ke koleksi

  2. Tentukan izin berikut dalam peran pipeline untuk dibaca dari sumbernya:

    { "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Action":"es:ESHttpGet", "Resource":[ "arn:aws:es:us-east-1:{account-id}:domain/{domain-name}/", "arn:aws:es:us-east-1:{account-id}:domain/{domain-name}/_cat/indices", "arn:aws:es:us-east-1:{account-id}:domain/{domain-name}/_search", "arn:aws:es:us-east-1:{account-id}:domain/{domain-name}/_search/scroll", "arn:aws:es:us-east-1:{account-id}:domain/{domain-name}/*/_search" ] }, { "Effect":"Allow", "Action":"es:ESHttpPost", "Resource":[ "arn:aws:es:us-east-1:{account-id}:domain/{domain-name}/*/_search/point_in_time", "arn:aws:es:us-east-1:{account-id}:domain/{domain-name}/*/_search/scroll" ] }, { "Effect":"Allow", "Action":"es:ESHttpDelete", "Resource":[ "arn:aws:es:us-east-1:{account-id}:domain/{domain-name}/_search/point_in_time", "arn:aws:es:us-east-1:{account-id}:domain/{domain-name}/_search/scroll" ] } ] }

Membuat pipa

Setelah Anda melampirkan kebijakan ke peran pipeline, gunakan cetak biru AWSOpenSearchDataMigrationPipelinemigrasi untuk membuat pipeline. Cetak biru ini mencakup konfigurasi default untuk memigrasikan data antara domain atau koleksi OpenSearch Layanan. Untuk informasi selengkapnya, lihat Menggunakan cetak biru untuk membuat pipeline.

catatan

OpenSearch Ingestion menggunakan versi dan distribusi domain sumber Anda untuk menentukan mekanisme apa yang akan digunakan untuk migrasi. Beberapa versi mendukung point_in_time opsi ini. OpenSearch Tanpa server menggunakan search_after opsi karena tidak mendukung point_in_time atau. scroll

Indeks baru mungkin sedang dalam proses dibuat selama proses migrasi, atau dokumen mungkin diperbarui saat migrasi sedang berlangsung. Karena itu, Anda mungkin perlu melakukan pemindaian tunggal atau beberapa pemindaian data indeks domain Anda untuk mengambil data baru atau yang diperbarui.

Tentukan jumlah pemindaian yang akan dijalankan dengan mengonfigurasi index_read_count dan interval dalam konfigurasi pipeline. Contoh berikut menunjukkan cara melakukan beberapa pemindaian:

scheduling: interval: "PT2H" index_read_count: 3 start_time: "2023-06-02T22:01:30.00Z"

OpenSearch Ingestion menggunakan konfigurasi berikut untuk memastikan bahwa data Anda ditulis ke indeks yang sama dan mempertahankan ID dokumen yang sama:

index: "${getMetadata(\"opensearch-index\")}" document_id: "${getMetadata(\"opensearch-document_id\")}"

Menentukan beberapa sink domain OpenSearch Layanan

Anda dapat menentukan beberapa domain OpenSearch Layanan publik sebagai tujuan untuk data Anda. Anda dapat menggunakan kemampuan ini untuk melakukan perutean bersyarat atau mereplikasi data yang masuk ke beberapa domain Layanan. OpenSearch Anda dapat menentukan hingga 10 domain OpenSearch Layanan publik yang berbeda sebagai sink.

Dalam contoh berikut, data yang masuk dirutekan secara kondisional ke domain Layanan yang berbeda OpenSearch :

... route: - 2xx_status: "/response >= 200 and /response < 300" - 5xx_status: "/response >= 500 and /response < 600" sink: - opensearch: hosts: [ "https://search-response-2xx.us-east-1.es.amazonaws.com" ] aws: sts_role_arn: "arn:aws:iam::123456789012:role/Example-Role" region: "us-east-1" index: "response-2xx" routes: - 2xx_status - opensearch: hosts: [ "https://search-response-5xx.us-east-1.es.amazonaws.com" ] aws: sts_role_arn: "arn:aws:iam::123456789012:role/Example-Role" region: "us-east-1" index: "response-5xx" routes: - 5xx_status

Migrasi data ke koleksi OpenSearch VPC Tanpa Server

Anda dapat menggunakan OpenSearch Ingestion untuk memigrasikan data dari domain OpenSearch Layanan sumber atau koleksi Tanpa OpenSearch Server ke sink koleksi VPC. Anda harus memberikan kebijakan akses jaringan dalam konfigurasi pipeline. Untuk informasi selengkapnya tentang konsumsi data ke dalam koleksi VPC OpenSearch Tanpa Server, lihat. Tutorial: Menelan data ke dalam koleksi menggunakan Amazon OpenSearch Ingestion

Untuk memigrasikan data ke koleksi VPC
  1. Buat koleksi OpenSearch Tanpa Server. Untuk petunjuk, lihat Tutorial: Menelan data ke dalam koleksi menggunakan Amazon OpenSearch Ingestion.

  2. Buat kebijakan jaringan untuk koleksi yang menentukan akses VPC ke titik akhir koleksi dan titik akhir Dasbor. Untuk petunjuk, lihat Akses jaringan untuk Amazon Tanpa OpenSearch Server.

  3. Buat peran pipeline jika Anda belum memilikinya. Untuk petunjuk, lihat Peran pipa.

  4. Buat pipa. Untuk petunjuk, lihat Menggunakan cetak biru untuk membuat pipeline.