(Opsional) Migrasikan aliran data dari Data Wrangler di Studio Classic - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

(Opsional) Migrasikan aliran data dari Data Wrangler di Studio Classic

penting

Saat ini, impor file aliran data ke Data Wrangler di SageMaker Canvas hanya hidup sebagai berikut: Wilayah AWS

  • AS Timur (N. Virginia)

  • AS Timur (Ohio)

  • AS Barat (Oregon)

Jika sebelumnya Anda telah menggunakan Amazon SageMaker Data Wrangler di Amazon SageMaker Studio Classic untuk tugas persiapan data, Anda dapat bermigrasi ke Amazon SageMaker Studio baru dan mengakses Data Wrangler versi terbaru di Amazon Canvas. SageMaker Data Wrangler di SageMaker Canvas memberi Anda pengalaman pengguna yang disempurnakan dan akses ke fitur-fitur terbaru, seperti antarmuka bahasa alami dan kinerja yang lebih cepat.

Anda dapat melakukan onboard ke SageMaker Canvas kapan saja untuk mulai menggunakan pengalaman Data Wrangler yang baru. Untuk informasi selengkapnya, lihat Memulai dengan menggunakan Amazon SageMaker Canvas.

Jika Anda memiliki file aliran data yang disimpan di Studio Classic yang sebelumnya Anda kerjakan, Anda dapat onboard ke Studio dan kemudian mengimpor file aliran ke Canvas. Panduan berikut menjelaskan cara memigrasi file aliran data Anda. Dari Studio Classic, Anda dapat mengekspor file ke Amazon S3 atau mengunduhnya ke mesin lokal Anda. Kemudian, Anda masuk ke aplikasi SageMaker Canvas, mengimpor file aliran, dan melanjutkan tugas persiapan data Anda.

Prasyarat

Tinjau prasyarat berikut sebelum Anda mulai memigrasikan file alur.

Langkah 1. Migrasi domain dan berikan izin

Sebelum memigrasi file aliran data, Anda harus mengikuti langkah-langkah spesifik dari Migrasi dari Amazon SageMaker Studio Classic panduan ini untuk memastikan bahwa peran eksekusi AWS IAM profil pengguna Anda memiliki izin yang diperlukan. Ikuti Prasyarat dan Fase 1: Migrasikan UI dari Studio Classic ke Studio sebelum melanjutkan, yang menjelaskan cara memberikan izin yang diperlukan, mengonfigurasi Studio sebagai pengalaman baru, dan memigrasikan domain yang sudah ada.

Secara khusus, Anda harus memiliki izin untuk membuat aplikasi SageMaker Canvas dan menggunakan fitur persiapan data SageMaker Canvas. Untuk mendapatkan izin ini, Anda dapat:

Pastikan untuk menggunakan profil pengguna yang sama untuk Studio dan SageMaker Canvas.

Setelah menyelesaikan prasyarat yang diuraikan dalam panduan migrasi, Anda harus memiliki domain baru dengan izin yang diperlukan untuk mengakses Canvas melalui Studio. SageMaker

Langkah 2. (Opsional) Siapkan lokasi Amazon S3

Jika Anda berencana menggunakan Amazon S3 untuk mentransfer file aliran alih-alih menggunakan opsi unduhan lokal, Anda harus memiliki bucket Amazon S3 di akun yang ingin Anda gunakan untuk menyimpan file aliran.

Ekspor file aliran dari Studio Classic

catatan

Jika Anda telah memigrasikan data Studio Classic ke Amazon S3 dengan mengikuti petunjuknyaTahap 3: (Opsional) Migrasikan data dari Studio Classic ke Studio, Anda dapat melewati langkah ini dan langsung menuju ke bagian di mana Anda mengimpor file alur dari lokasi Amazon S3 tempat data Studio Classic disimpan. Impor file aliran ke Canvas

Anda dapat mengekspor file flow Anda dengan menyimpannya ke Amazon S3 atau mengunduhnya ke mesin lokal Anda. Saat Anda mengimpor file aliran ke SageMaker Canvas pada langkah berikutnya, jika Anda memilih opsi unggah lokal, maka Anda hanya dapat mengunggah 20 file aliran sekaligus. Jika Anda memiliki sejumlah besar file aliran untuk diimpor, kami sarankan Anda menggunakan Amazon S3 sebagai gantinya.

Ikuti instruksi di salah satu Metode 1: Gunakan Amazon S3 untuk mentransfer file aliran atau Metode 2: Gunakan mesin lokal Anda untuk mentransfer file aliran untuk melanjutkan.

Metode 1: Gunakan Amazon S3 untuk mentransfer file aliran

Dengan metode ini, Anda menggunakan Amazon S3 sebagai perantara antara Data Wrangler di Studio Classic dan Data Wrangler di SageMaker Canvas (diakses melalui versi terbaru Studio). Anda mengekspor file aliran dari Studio Classic ke Amazon S3, dan kemudian pada langkah berikutnya, Anda mengakses Canvas melalui Studio dan mengimpor file aliran dari Amazon S3.

Pastikan Anda memiliki bucket Amazon S3 yang disiapkan sebagai lokasi penyimpanan untuk file flow.

Gunakan prosedur berikut untuk mengekspor file flow Anda dari Studio Classic ke Amazon S3:

  1. Buka Studio Klasik.

  2. Buka terminal baru dengan melakukan hal berikut:

    1. Di bilah navigasi atas, pilih File.

    2. Dalam menu konteks, arahkan kursor ke New, lalu pilih Terminal.

  3. Secara default, terminal harus terbuka di direktori home Anda. Arahkan ke folder yang berisi semua file aliran yang ingin Anda migrasikan.

  4. Gunakan perintah berikut untuk menyinkronkan semua file flow ke lokasi Amazon S3 yang ditentukan. Ganti {bucket-name} dan {folder} dengan jalur ke lokasi Amazon S3 yang Anda inginkan. Untuk informasi selengkapnya tentang perintah dan parameter, lihat perintah sinkronisasi di Referensi AWS AWS CLI Perintah.

    aws s3 sync . s3://{bucket-name}/{folder}/ --exclude "*.*" --include "*.flow"

    Jika Anda menggunakan milik Anda sendiri AWS KMS key, maka gunakan perintah berikut sebagai gantinya untuk menyinkronkan file, dan tentukan ID kunci KMS Anda. Pastikan bahwa peran eksekusi IAM pengguna (yang seharusnya menjadi peran yang sama yang digunakan pada Langkah 1. Migrasi domain dan berikan izin dari Prasyarat sebelumnya) telah diberikan akses untuk menggunakan kunci KMS.

    aws s3 sync . s3://{bucket-name}/{folder}/ --exclude "*.*" --include "*.flow" --sse-kms-key-id {your-key-id}

File flow Anda sekarang harus diekspor. Anda dapat memeriksa bucket Amazon S3 Anda untuk memastikan bahwa file aliran berhasil disinkronkan.

Untuk mengimpor file-file ini di versi terbaru Data Wrangler, ikuti langkah-langkahnya. Impor file aliran ke Canvas

Metode 2: Gunakan mesin lokal Anda untuk mentransfer file aliran

Dengan metode ini, Anda mengunduh file aliran dari Studio Classic ke mesin lokal Anda. Anda dapat mengunduh file secara langsung, atau Anda dapat mengompresnya sebagai arsip zip. Kemudian, Anda membongkar file zip secara lokal (jika ada), masuk ke Canvas, dan mengimpor file aliran dengan mengunggahnya dari mesin lokal Anda.

Gunakan prosedur berikut untuk mengunduh file aliran Anda dari Studio Classic:

  1. Buka Studio Klasik.

  2. (Opsional) Jika Anda ingin mengompres beberapa file aliran ke dalam arsip zip dan mengunduh semuanya sekaligus, lakukan hal berikut:

    1. Di bilah navigasi atas Studio Classic, pilih File.

    2. Dalam menu konteks, arahkan kursor ke New, lalu pilih Terminal.

    3. Secara default, terminal terbuka di direktori home Anda. Arahkan ke folder yang berisi semua file aliran yang ingin Anda migrasikan.

    4. Gunakan perintah berikut untuk mengemas file aliran dalam direktori saat ini sebagai zip. Perintah tidak termasuk file tersembunyi:

      find . -not -path "*/.*" -name "*.flow" -print0 | xargs -0 zip my_archive.zip
  3. Unduh arsip zip atau file aliran individual ke mesin lokal Anda dengan melakukan hal berikut:

    1. Di panel navigasi kiri Studio Classic, pilih File Browser.

    2. Temukan file yang ingin Anda unduh di browser file.

    3. Klik kanan file, dan di menu konteks, pilih Unduh.

File harus diunduh ke mesin lokal Anda. Jika Anda mengemasnya sebagai arsip zip, ekstrak file secara lokal. Setelah file diekstraksi, untuk mengimpor file-file ini di versi terbaru Data Wrangler, ikuti langkah-langkahnya. Impor file aliran ke Canvas

Impor file aliran ke Canvas

Setelah mengekspor file flow Anda, akses Canvas melalui Studio dan impor file.

Gunakan prosedur berikut untuk mengimpor file flow ke Canvas:

  1. Buka Studio versi terbaru Anda.

  2. Di Studio, di panel Applications, pilih Canvas.

  3. Pada halaman Canvas, pilih Run Canvas. Jika Anda telah berhasil mengatur izin, ini membuat aplikasi Canvas untuk Anda. Aplikasi Canvas mungkin memakan waktu beberapa menit sebelum siap.

  4. Saat kanvas siap, pilih Open Canvas.

  5. Di panel navigasi kiri Canvas, pilih Data Wrangler.

  6. Di panel atas, pilih Impor aliran data.

  7. Untuk Sumber data, pilih Amazon S3 atau Unggahan lokal.

  8. Pilih file flow Anda dari bucket Amazon S3, atau unggah file dari mesin lokal Anda.

    catatan

    Untuk unggahan lokal, Anda dapat mengunggah maksimal 20 file aliran sekaligus. Untuk impor yang lebih besar, gunakan Amazon S3. Jika Anda memilih folder untuk diimpor, file aliran apa pun di sub-folder juga diimpor.

  9. Pilih Impor data.

Jika impor berhasil, Anda menerima pemberitahuan bahwa X jumlah file aliran berhasil diimpor.

Jika file flow Anda tidak berhasil diimpor, Anda menerima notifikasi di aplikasi SageMaker Canvas. Pilih Lihat kesalahan pada pesan notifikasi untuk memeriksa pesan kesalahan individual untuk panduan tentang cara memformat ulang file alur yang salah diformat.

Setelah file flow Anda selesai mengimpor, buka halaman Data Wrangler aplikasi SageMaker Canvas untuk melihat aliran data Anda. Anda dapat mencoba membuka aliran data untuk memverifikasi bahwa itu terlihat seperti yang diharapkan.