Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pertimbangan untuk SAS pada AWS
Latar belakang SAS
-
Ruang File Data Permanen SAS (SASDATA)
-
Menyimpan data persisten untuk eksploitasi SAS dan menghasilkan file keluaran SAS
-
Dibaca secara ekstensif dari, tetapi kurang luas ditulis kembali
-
-
Ruang File Data Kerja SAS (SASWORK)
-
Ruang kerja gores untuk pekerjaan SAS
-
Digunakan untuk melakukan aktivitas penyimpanan kerja prosedur SAS single-threaded
-
-
Ruang File Data Utilitas SAS (UTILLOC)
-
Jenis ruang yang sama dengan SASWORK untuk prosedur SAS multi-threaded
-
Secara default, ditempatkan sebagai subdirektori di bawah SASWORK
-
-
Penyimpanan tidak bertahan melalui reboot atau restart perangkat solid state internal (SSD) yang disatukan dalam konfigurasi RAID 0. Sebaiknya gunakan instans dengan perangkat ephemeral non-volatile memory express (NVMe) dengan bandwidth tinggi, latensi rendah, dan I/O sekuensial. Instans ini ideal untuk data SAS sementara (SASWORK dan UTILLOC).
Sistem file bersama SAS (diperlukan untuk SAS Grid)
-
AWS mengatur sistem file Lustre dengan opsirw,seclabel, dan lazystatfs mount. Ini bukan opsi pemasangan yang disarankan untuk SAS Grid, jadi Anda harus melepas ini FSx untuk sistem file Lustre dan memasangnya kembali dengan parameter. flock
-
Anda tidak dapat memperluas ukuran sistem file Lustre Anda. Untuk mengubah ukuran, buat sistem file Lustre yang lebih besar dan salin data dari sistem lama ke yang baru.
-
FSx Untuk sistem file persisten Lustre, data direplikasi dalam satu Availability Zone untuk meningkatkan daya tahan. Itu tidak direplikasi di seluruh AWS Availability Zones.
-
Kami menyarankan Anda menggunakan opsi penyimpanan Amazon S3 untuk digunakan dengan SAS Grid dan FSx untuk Lustre. Untuk informasi selengkapnya, lihat Menggunakan Repositori Data dengan FSx for Lustre dalam dokumentasi. AWS
-
Lihat tabel AWS Wilayah
untuk ketersediaan layanan di seluruh AWS Wilayah dan Availability Zone. Juga tinjau replikasi Amazon S3 Same-region (SRR) atau replikasi lintas wilayah (CRR) untuk implikasi kebutuhan replikasi data untuk ketersediaan tinggi.
Jenis instans tingkat server SAS Grid
Server SAS Grid perlu cepat CPUs untuk memproses data. Kami merekomendasikan:
-
Minimal 8 GB RAM fisik per inti fisik, dan throughput I/O yang kuat (terutama untuk SASWORK dan SAS UTILLOC).
-
Instans I3 - Instans
Amazon EC2 I3 dioptimalkan untuk penyimpanan untuk transaksi tinggi, beban kerja latensi rendah. Instans ini mencakup instans NVMe berbasis SSD yang dioptimalkan penyimpanan untuk kinerja I/O acak tinggi, throughput baca sekuensial tinggi, dan IOPS tinggi. Karena bandwidth I/O internal yang tinggi dari drive NVMe SSD bergaris untuk SASWORK dan SAS UTILLOC, Anda harus mengonfigurasi lingkungan Anda untuk secara eksplisit menggunakan drive lokal NVMe SSD berbasis alih-alih volume Amazon EBS. -
Instans i3EN - Rangkaian ini menyediakan instans
NVMe SSD yang dioptimalkan penyimpanan di Amazon EC2 dengan jaringan yang disempurnakan melalui ENA untuk mencapai bandwidth jaringan hingga 100 Gbps. -
Instans M5n
- Keluarga M5 menyediakan keseimbangan komputasi, memori, dan jaringan. Instans M5n ideal untuk aplikasi yang membutuhkan peningkatan throughput jaringan dan kinerja laju paket. -
Beban kerja SAS dapat dicirikan sebagai permintaan I/O berurutan yang didominasi besar dengan volume data yang tinggi. Kami menyarankan Anda menentukan pola penggunaan SAS Anda. Ini akan memandu arsitektur dan pengaturan optimal dari sistem file yang mendasari individu dan penyediaan I/O fisik masing-masing.
-
Kueri, pelaporan, dan pekerjaan statistik ringan biasanya berkinerja baik dengan tingkat I/O 100 MiB per detik per inti CPU fisik.
-
Analisis lanjutan dan pekerjaan statistik berat mungkin memerlukan hingga 150 MiB per detik per inti CPU fisik.
-
Secara keseluruhan, kami merekomendasikan tingkat throughput I/O minimum 100-125 MiB per detik per inti CPU fisik.
-
Jenis instans tingkat menengah dan server metadata SAS Grid
Server ini tidak memerlukan sumber daya komputasi intensif atau throughput I/O yang kuat. Mereka memang membutuhkan akses ke lebih banyak memori daripada tingkatan komputasi SAS. Kami merekomendasikan:
-
Minimal 24 GB RAM fisik atau 8 GB RAM fisik per inti fisik, mana yang lebih besar.
-
Instans R5 atau R5d — Instans
ini cocok untuk aplikasi intensif memori seperti cache dalam memori, database dalam memori menengah, dan analitik data besar waktu nyata.
Ketersediaan tinggi dan pemulihan bencana untuk SAS Grid
Perencanaan pemulihan bencana penting untuk setiap sistem bisnis penting, termasuk sistem produksi yang menjalankan SAS Intelligence Platform dan solusi SAS.
Pemulihan bencana tidak sama dengan ketersediaan yang tinggi. Meskipun kedua konsep tersebut terkait dengan kelangsungan bisnis, ketersediaan yang tinggi adalah tentang menyediakan kelangsungan operasi yang tidak terganggu. Sebaliknya, pemulihan bencana melibatkan sejumlah waktu henti, biasanya diukur dalam jam atau hari.