Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pilar keunggulan operasional
Pilar keunggulan operasional dari AWS Well-Architected Framework berfokus pada menjalankan dan memantau sistem, dan terus meningkatkan proses dan prosedur. Ini mencakup kemampuan untuk mendukung pengembangan dan menjalankan beban kerja secara efektif, mendapatkan wawasan tentang operasi mereka, dan terus meningkatkan proses dan prosedur pendukung untuk memberikan nilai bisnis. Anda dapat mengurangi kompleksitas operasional melalui beban kerja penyembuhan diri, yang mendeteksi dan memperbaiki sebagian besar masalah tanpa campur tangan manusia. Anda dapat mencapai tujuan ini dengan mengikuti praktik terbaik yang dijelaskan di bagian ini, dan menggunakan metrik Amazon Neptunus Analytics APIs, serta mekanisme untuk merespons dengan benar ketika beban kerja Anda menyimpang dari perilaku yang diharapkan.
Diskusi pilar keunggulan operasional ini berfokus pada bidang-bidang utama berikut:
-
Infrastruktur sebagai kode (IAc)
-
Manajemen perubahan
-
Strategi ketahanan
-
Manajemen insiden
-
Pelaporan audit untuk kepatuhan
-
Pencatatan log dan pemantauan
Mengotomatiskan penerapan menggunakan pendekatan IAc
Praktik terbaik untuk mengotomatisasi penyebaran di Neptunus dengan menggunakan IAc meliputi:
-
Terapkan IAc untuk menyebarkan grafik Neptunus Analytics dan sumber daya terkait. Untuk konfigurasi lingkungan yang konsisten, gunakan dukungan untuk Neptunus Analytics yang disediakan AWS CloudFormationoleh untuk menyediakan grafik dan titik akhir pribadi.
-
Gunakan CloudFormation untuk menyediakan instans notebook Neptunus di Amazon AI. SageMaker Anda dapat menggunakan buku catatan untuk menanyakan dan memvisualisasikan data dalam grafik Neptunus Analytics.
-
Mengotomatiskan prosedur operasional Neptunus Analytics, seperti mengubah ukuran grafik, menghapus dan memotret grafik, memulihkan grafik dari snapshot, dan mengatur ulang dan memuat ulang grafik. Gunakan Neptune Analytics API, yang tersedia melalui AWS CLI() atau AWS Command Line Interface SDK
s. -
Nilai waktu aktif yang diperlukan dari grafik Anda. Analytics sering bersifat sementara; grafik hanya diperlukan untuk waktu yang Anda butuhkan untuk menjalankan algoritme. Jika ini masalahnya, gunakan AWS CLI atau SDKs untuk snapshot dan hapus grafik saat tidak lagi diperlukan. Anda kemudian dapat mengembalikannya dari snapshot nanti, jika perlu.
-
Simpan string koneksi secara eksternal dari klien Anda. Anda dapat menyimpan string koneksi di AWS Secrets Manager, Amazon DynamoDB, atau lokasi mana pun di mana mereka dapat diubah secara dinamis.
-
Gunakan tag untuk menambahkan metadata ke sumber daya Neptunus Analytics Anda, dan lacak penggunaan berdasarkan tag. Tag membantu mengatur sumber daya Anda. Misalnya, Anda dapat menerapkan tag umum ke sumber daya di lingkungan atau aplikasi tertentu. Anda juga dapat menggunakan tag untuk menganalisis penagihan penggunaan sumber daya; untuk informasi selengkapnya, lihat Mengatur dan melacak biaya menggunakan tag alokasi AWS biaya di Panduan Pengguna AWS Penagihan. Selain itu, Anda dapat menggunakan kondisi dalam kebijakan AWS Identity and Access Management (IAM) untuk mengontrol akses ke AWS sumber daya berdasarkan tag yang digunakan pada sumber daya tersebut. Anda dapat melakukan ini dengan menggunakan kunci kondisi
aws:ResourceTag/tag-key
global. Untuk informasi selengkapnya, lihat Mengontrol akses ke AWS sumber daya di Panduan Pengguna IAM.
Desain operasi
Mengadopsi pendekatan untuk meningkatkan cara Anda mengoperasikan grafik Neptunus Analytics:
-
Pertahankan grafik Neptunus Analytics terpisah untuk pengembangan, pengujian, dan penggunaan produksi. Grafik ini mungkin memiliki kumpulan data, pengguna, dan kontrol operasional yang berbeda.
-
Pertahankan grafik Neptunus Analytics terpisah untuk penggunaan yang berbeda. Misalnya, jika dua kelompok pengguna analitis memerlukan grafik terpisah dengan garis waktu, model, kinerja dan ketersediaan yang berbeda SLAs, dan pola penggunaan, pertahankan grafik terpisah untuk setiap grup.
-
Mempersiapkan pengguna dan staf operasional untuk pembaruan pemeliharaan Neptunus Analytics.
Buat perubahan yang sering, kecil, dan reversibel
Rekomendasi berikut berfokus pada perubahan kecil dan reversibel yang dapat Anda lakukan untuk meminimalkan kompleksitas dan mengurangi kemungkinan gangguan beban kerja:
-
Simpan templat dan skrip IAC dalam layanan kontrol sumber seperti GitHub atau. GitLab
penting
Jangan menyimpan AWS kredensil dalam kontrol sumber.
-
Memerlukan penyebaran IAC untuk menggunakan layanan integrasi berkelanjutan dan pengiriman berkelanjutan (CI/CD) seperti atau. AWS CodeDeployAWS CodeBuild Kompilasi, uji, dan terapkan kode di lingkungan Neptunus Analytics non-produksi sebelum mempromosikannya ke grafik produksi.
Menerapkan observabilitas untuk wawasan yang dapat ditindaklanjuti
Dapatkan pemahaman yang komprehensif tentang perilaku beban kerja, kinerja, keandalan, biaya, dan kesehatan. Rekomendasi berikut membantu Anda mendapatkan tingkat pemahaman tersebut di Neptunus Analytics:
-
Pantau CloudWatch metrik Amazon untuk Neptunus Analytics. Dari metrik ini, Anda dapat menentukan ukuran grafik (jumlah node, tepi, dan vektor, ditambah ukuran byte total), pemanfaatan CPU, dan permintaan kueri dan tingkat kesalahan.
-
Buat CloudWatch dasbor dan alarm untuk metrik utama seperti
NumQueuedRequestsPerSec
,,,NumOpenCypherRequestsPerSec
GraphStorageUsagePercent
GraphSizeBytes
, danCPUUtilization
serta respons klien Neptunus yang ditemukan di log aplikasi Anda. -
Tetapkan notifikasi untuk memantau kesehatan grafik Neptunus Analytics seperti ketika ukuran grafik, tingkat permintaan, atau pemanfaatan CPU melebihi ambang batas Anda. Misalnya, jika
GraphStorageUsagePercent
telah naik menjadi 90 persen pada grafik yang ingin Anda tumbuhkan secara signifikan, putuskan apakah akan meningkatkan kapasitas Unit Kapasitas Neptunus (m-NCU) yang dioptimalkan untuk memori. Jika m-NCU saat ini 128, meningkatkannya menjadi 256 akan mengurangi penyimpanan sekitar 45 persen. JikaNumQueuedRequestsPerSec
seringkali lebih besar dari nol, pertimbangkan untuk meningkatkan kapasitas m-NCU untuk menyediakan lebih banyak kapasitas komputasi. Atau, Anda dapat mengurangi konkurensi sisi klien.
Belajar dari semua kegagalan operasional
Infrastruktur penyembuhan diri adalah upaya jangka panjang yang berkembang dalam iterasi karena masalah langka terjadi atau respons tidak seefektif yang diinginkan. Mengadopsi praktik-praktik berikut mendorong fokus ke arah tujuan itu:
-
Mendorong peningkatan dengan belajar dari semua kegagalan.
-
Bagikan apa yang dipelajari di seluruh tim dan organisasi. Jika beberapa tim dalam organisasi Anda menggunakan Neptunus, buat ruang obrolan umum atau grup pengguna untuk berbagi pembelajaran dan praktik terbaik.
Gunakan kemampuan logging untuk memantau aktivitas yang tidak sah atau anomali
Gunakan logging untuk mengamati kinerja anomali dan pola aktivitas. Pertimbangkan praktik terbaik berikut:
-
Neptune Analytics mendukung pencatatan tindakan bidang kontrol dengan menggunakan. AWS CloudTrail Untuk informasi selengkapnya, lihat Mencatat panggilan API Neptune Analytics menggunakan. AWS CloudTrail Melalui kemampuan ini, Anda dapat melacak pembuatan, pembaruan, dan penghapusan sumber daya Neptunus Analytics. Untuk pemantauan dan peringatan yang kuat, Anda juga dapat mengintegrasikan CloudTrail peristiwa dengan Amazon CloudWatch Logs. Untuk meningkatkan analisis aktivitas layanan Neptunus Analytics dan mengidentifikasi perubahan aktivitas untuk Akun AWS sebuah, Anda dapat melakukan CloudTrail kueri log dengan menggunakan Amazon Athena. Misalnya, Anda dapat menggunakan kueri untuk mengidentifikasi tren dan mengisolasi aktivitas lebih lanjut berdasarkan atribut seperti alamat IP sumber atau pengguna.
-
Anda juga dapat menggunakan CloudTrail untuk mengaktifkan pencatatan aktivitas bidang data Neptunus Analytics seperti eksekusi kueri. Anda dapat melihat kueri mana yang sedang dijalankan, frekuensinya, dan sumbernya. Secara default, CloudTrail tidak mencatat peristiwa data. Biaya tambahan berlaku untuk peristiwa data. Untuk informasi selengkapnya, lihat harga AWS CloudTrail
. -
Anda juga dapat mencatat panggilan aplikasi Anda ke Neptunus Analytics baik di bidang kontrol atau bidang data. Misalnya, jika Anda menggunakan AWS SDK untuk Python (Boto3)
untuk membuat kueri, Anda dapat mengaktifkan logging tingkat debug untuk mendapatkan jejak kueri ke konsol atau file. Ini berguna selama pengembangan. Kami juga menyarankan Anda menangkap dan mencatat pengecualian dari aplikasi Anda.