Pilar keunggulan operasional - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pilar keunggulan operasional

Pilar keunggulan operasional dari AWS Well-Architected Framework berfokus pada menjalankan dan memantau sistem, dan terus meningkatkan proses dan prosedur. Ini mencakup kemampuan untuk mendukung pengembangan dan menjalankan beban kerja secara efektif, mendapatkan wawasan tentang operasi mereka, dan terus meningkatkan proses dan prosedur pendukung untuk memberikan nilai bisnis. Anda dapat mengurangi kompleksitas operasional melalui beban kerja penyembuhan diri, yang mendeteksi dan memperbaiki sebagian besar masalah tanpa campur tangan manusia. Anda dapat mencapai tujuan ini dengan mengikuti praktik terbaik yang dijelaskan di bagian ini, dan menggunakan metrik Amazon Neptunus Analytics APIs, serta mekanisme untuk merespons dengan benar ketika beban kerja Anda menyimpang dari perilaku yang diharapkan.

Diskusi pilar keunggulan operasional ini berfokus pada bidang-bidang utama berikut:

  • Infrastruktur sebagai kode (IAc)

  • Manajemen perubahan

  • Strategi ketahanan

  • Manajemen insiden

  • Pelaporan audit untuk kepatuhan

  • Pencatatan log dan pemantauan

Mengotomatiskan penerapan menggunakan pendekatan IAc

Praktik terbaik untuk mengotomatisasi penyebaran di Neptunus dengan menggunakan IAc meliputi:

Desain operasi

Mengadopsi pendekatan untuk meningkatkan cara Anda mengoperasikan grafik Neptunus Analytics:

  • Pertahankan grafik Neptunus Analytics terpisah untuk pengembangan, pengujian, dan penggunaan produksi. Grafik ini mungkin memiliki kumpulan data, pengguna, dan kontrol operasional yang berbeda.

  • Pertahankan grafik Neptunus Analytics terpisah untuk penggunaan yang berbeda. Misalnya, jika dua kelompok pengguna analitis memerlukan grafik terpisah dengan garis waktu, model, kinerja dan ketersediaan yang berbeda SLAs, dan pola penggunaan, pertahankan grafik terpisah untuk setiap grup.

  • Mempersiapkan pengguna dan staf operasional untuk pembaruan pemeliharaan Neptunus Analytics.

Buat perubahan yang sering, kecil, dan reversibel

Rekomendasi berikut berfokus pada perubahan kecil dan reversibel yang dapat Anda lakukan untuk meminimalkan kompleksitas dan mengurangi kemungkinan gangguan beban kerja:

  • Simpan templat dan skrip IAC dalam layanan kontrol sumber seperti GitHub atau. GitLab

    penting

    Jangan menyimpan AWS kredensil dalam kontrol sumber.

  • Memerlukan penyebaran IAC untuk menggunakan layanan integrasi berkelanjutan dan pengiriman berkelanjutan (CI/CD) seperti atau. AWS CodeDeployAWS CodeBuild Kompilasi, uji, dan terapkan kode di lingkungan Neptunus Analytics non-produksi sebelum mempromosikannya ke grafik produksi.

Menerapkan observabilitas untuk wawasan yang dapat ditindaklanjuti

Dapatkan pemahaman yang komprehensif tentang perilaku beban kerja, kinerja, keandalan, biaya, dan kesehatan. Rekomendasi berikut membantu Anda mendapatkan tingkat pemahaman tersebut di Neptunus Analytics:

  • Pantau CloudWatch metrik Amazon untuk Neptunus Analytics. Dari metrik ini, Anda dapat menentukan ukuran grafik (jumlah node, tepi, dan vektor, ditambah ukuran byte total), pemanfaatan CPU, dan permintaan kueri dan tingkat kesalahan.

  • Buat CloudWatch dasbor dan alarm untuk metrik utama sepertiNumQueuedRequestsPerSec,,, NumOpenCypherRequestsPerSec GraphStorageUsagePercentGraphSizeBytes, dan CPUUtilization serta respons klien Neptunus yang ditemukan di log aplikasi Anda.

  • Tetapkan notifikasi untuk memantau kesehatan grafik Neptunus Analytics seperti ketika ukuran grafik, tingkat permintaan, atau pemanfaatan CPU melebihi ambang batas Anda. Misalnya, jika GraphStorageUsagePercent telah naik menjadi 90 persen pada grafik yang ingin Anda tumbuhkan secara signifikan, putuskan apakah akan meningkatkan kapasitas Unit Kapasitas Neptunus (m-NCU) yang dioptimalkan untuk memori. Jika m-NCU saat ini 128, meningkatkannya menjadi 256 akan mengurangi penyimpanan sekitar 45 persen. Jika NumQueuedRequestsPerSec seringkali lebih besar dari nol, pertimbangkan untuk meningkatkan kapasitas m-NCU untuk menyediakan lebih banyak kapasitas komputasi. Atau, Anda dapat mengurangi konkurensi sisi klien.

Belajar dari semua kegagalan operasional

Infrastruktur penyembuhan diri adalah upaya jangka panjang yang berkembang dalam iterasi karena masalah langka terjadi atau respons tidak seefektif yang diinginkan. Mengadopsi praktik-praktik berikut mendorong fokus ke arah tujuan itu:

  • Mendorong peningkatan dengan belajar dari semua kegagalan.

  • Bagikan apa yang dipelajari di seluruh tim dan organisasi. Jika beberapa tim dalam organisasi Anda menggunakan Neptunus, buat ruang obrolan umum atau grup pengguna untuk berbagi pembelajaran dan praktik terbaik.

Gunakan kemampuan logging untuk memantau aktivitas yang tidak sah atau anomali

Gunakan logging untuk mengamati kinerja anomali dan pola aktivitas. Pertimbangkan praktik terbaik berikut:

  • Neptune Analytics mendukung pencatatan tindakan bidang kontrol dengan menggunakan. AWS CloudTrail Untuk informasi selengkapnya, lihat Mencatat panggilan API Neptune Analytics menggunakan. AWS CloudTrail Melalui kemampuan ini, Anda dapat melacak pembuatan, pembaruan, dan penghapusan sumber daya Neptunus Analytics. Untuk pemantauan dan peringatan yang kuat, Anda juga dapat mengintegrasikan CloudTrail peristiwa dengan Amazon CloudWatch Logs. Untuk meningkatkan analisis aktivitas layanan Neptunus Analytics dan mengidentifikasi perubahan aktivitas untuk Akun AWS sebuah, Anda dapat melakukan CloudTrail kueri log dengan menggunakan Amazon Athena. Misalnya, Anda dapat menggunakan kueri untuk mengidentifikasi tren dan mengisolasi aktivitas lebih lanjut berdasarkan atribut seperti alamat IP sumber atau pengguna.

  • Anda juga dapat menggunakan CloudTrail untuk mengaktifkan pencatatan aktivitas bidang data Neptunus Analytics seperti eksekusi kueri. Anda dapat melihat kueri mana yang sedang dijalankan, frekuensinya, dan sumbernya. Secara default, CloudTrail tidak mencatat peristiwa data. Biaya tambahan berlaku untuk peristiwa data. Untuk informasi selengkapnya, lihat harga AWS CloudTrail.

  • Anda juga dapat mencatat panggilan aplikasi Anda ke Neptunus Analytics baik di bidang kontrol atau bidang data. Misalnya, jika Anda menggunakan AWS SDK untuk Python (Boto3)untuk membuat kueri, Anda dapat mengaktifkan logging tingkat debug untuk mendapatkan jejak kueri ke konsol atau file. Ini berguna selama pengembangan. Kami juga menyarankan Anda menangkap dan mencatat pengecualian dari aplikasi Anda.