Memecahkan masalah gateway file - AWSStorage Gateway

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memecahkan masalah gateway file

Anda dapat mengonfigurasi gateway file Anda dengan grup log Amazon CloudWatch saat menjalankan VMware vSphere High Availability (HA). Jika Anda melakukannya, Anda menerima pemberitahuan tentang status kesehatan gateway file Anda dan tentang kesalahan yang dihadapi gateway file. Anda dapat menemukan informasi tentang pemberitahuan kesalahan dan kesehatan ini di CloudWatch Logs.

Pada bagian berikut, Anda dapat menemukan informasi yang dapat membantu Anda memahami penyebab setiap pemberitahuan kesalahan dan kesehatan serta cara memperbaiki masalah.

Kesalahan: ObjectMissing

Anda bisa mendapatkanObjectMissingerror saat penulis selain gateway file yang ditentukan menghapus file yang ditentukan dari Amazon FSx. Setiap upload berikutnya ke Amazon FSx atau pengambilan dari Amazon FSx untuk objek gagal.

Untuk mengatasi kesalahan ObjectMissing
  1. Simpan salinan terbaru dari file ke sistem file lokal klien SMB Anda (Anda perlu salinan file ini di langkah 3).

  2. Hapus file dari file gateway menggunakan klien SMB Anda.

  3. Salin versi terbaru dari file yang Anda simpan di langkah 1 Amazon FSx menggunakan klien SMB Anda. Lakukan ini melalui gateway file Anda.

Notifikasi: Mulai ulang

Anda bisa mendapatkan notifikasi reboot saat gateway VM dimulai ulang. Anda dapat memulai ulang gateway VM dengan menggunakan konsol Manajemen Hypervisor VM atau konsol Storage Gateway. Anda juga dapat me-restart dengan menggunakan perangkat lunak gateway selama siklus pemeliharaan gateway.

Jika waktu reboot dalam waktu 10 menit dari gateway yang dikonfigurasiwaktu mulai pemeliharaan, reboot ini mungkin merupakan kejadian normal dan bukan pertanda masalah. Jika reboot terjadi secara signifikan di luar jendela pemeliharaan, periksa apakah gateway dimulai ulang secara manual.

Notifikasi: HardReboot

Anda bisa mendapatkanHardRebootpemberitahuan saat gateway VM dimulai ulang secara tak terduga. Restart semacam itu bisa disebabkan oleh hilangnya daya, kegagalan perangkat keras, atau kejadian lain. Untuk gateway VMware, reset oleh vSphere High Availability Application Monitoring dapat memicu acara ini.

Ketika gateway Anda berjalan di lingkungan seperti itu, periksa keberadaanHealthCheckFailurepemberitahuan dan berkonsultasi dengan log peristiwa VMware untuk VM.

Notifikasi: HealthCheckFailure

Untuk gateway di VMware vSphere HA, Anda bisa mendapatkanHealthCheckFailurepemberitahuan ketika pemeriksaan kesehatan gagal dan restart VM diminta. Peristiwa ini juga terjadi selama tes untuk memantau ketersediaan, yang ditunjukkan olehAvailabilityMonitorTestnotifikasi. Dalam kasus ini,HealthCheckFailurenotifikasi yang diharapkan.

catatan

Pemberitahuan ini hanya untuk gateway VMware.

Jika acara ini berulang kali terjadi tanpaAvailabilityMonitorTestpemberitahuan, periksa infrastruktur VM Anda untuk masalah (penyimpanan, memori, dan sebagainya). Jika Anda memerlukan bantuan tambahan, hubungiAWS Support.

Notifikasi: AvailabilityMonitorTest

Anda mendapatkanAvailabilityMonitorTestpemberitahuan ketika Andamenjalankan tesdariKetersediaan dan pemantauan aplikasisistem pada gateway yang berjalan pada platform VMware vSphere HA.

Kesalahan: RoleTrustRelationshipInvalid

Anda mendapatkan kesalahan ini ketika peran IAM untuk berbagi file memiliki hubungan kepercayaan IAM yang salah dikonfigurasi (yaitu, peran IAM tidak mempercayai prinsipal Storage Gateway bernamastoragegateway.amazonaws.com). Akibatnya, file gateway tidak akan bisa mendapatkan kredensyal untuk menjalankan operasi apa pun pada bucket S3 yang mendukung berbagi file.

Untuk menyelesaikan kesalahan RoleTrustRelationshipInvalid

Memecahkan masalah dengan metrik CloudWatch

Anda dapat menemukan informasi berikut tentang tindakan untuk mengatasi masalah dalam menggunakan metrik Amazon CloudWatch dengan Storage Gateway.

Gateway Anda bereaksi perlahan saat menelusuri direktori

Jika gateway file Anda bereaksi perlahan saat Anda menjalankanlsperintah atau isi direktori, periksaIndexFetchdanIndexEvictionMetrik CloudWatch:

  • JikaIndexFetchmetrik lebih besar dari 0 saat Anda menjalankanlsperintah atau isi direktori, file gateway Anda dimulai tanpa informasi tentang isi direktori terpengaruh dan harus mengakses Amazon S3. Upaya selanjutnya untuk daftar isi direktori itu harus berjalan lebih cepat.

  • JikaIndexEvictionmetrik lebih besar dari 0, itu berarti bahwa file gateway Anda telah mencapai batas apa yang dapat mengelola dalam cache pada waktu itu. Dalam hal ini, gateway file Anda harus membebaskan beberapa ruang penyimpanan dari direktori yang paling baru diakses untuk mencantumkan direktori baru. Jika ini sering terjadi dan ada dampak kinerja, hubungiAWS Support.

    Diskusi denganAWS Supportisi dari sistem file Amazon FSx terkait dan rekomendasi untuk meningkatkan kinerja berdasarkan kasus penggunaan Anda.

Gateway Anda tidak merespons

Jika gateway file Anda tidak merespons, lakukan hal berikut:

  • Jika ada reboot atau pembaruan perangkat lunak baru-baru ini, maka periksaIOWaitPercentmetrik. Metrik ini menunjukkan persentase waktu bahwa CPU idle ketika ada permintaan I/O yang luar biasa. Dalam beberapa kasus, ini mungkin tinggi (10 atau lebih besar) dan mungkin telah meningkat setelah server di-reboot atau diperbarui. Dalam kasus ini, maka file gateway Anda mungkin bottlenecked oleh disk root lambat karena membangun kembali cache indeks ke RAM. Anda dapat mengatasi masalah ini dengan menggunakan disk fisik yang lebih cepat untuk disk root.

  • JikaMemUsedBytesmetrik adalah pada atau hampir sama denganMemTotalBytesmetrik, maka file gateway Anda kehabisan RAM yang tersedia. Pastikan bahwa gateway file Anda memiliki setidaknya RAM minimum yang diperlukan. Jika sudah terjadi, pertimbangkan untuk menambahkan lebih banyak RAM ke gateway file Anda berdasarkan beban kerja dan kasus penggunaan Anda.

    Jika file share adalah SMB, masalahnya mungkin juga karena jumlah klien SMB yang terhubung ke berbagi file. Untuk melihat jumlah klien yang terhubung pada waktu tertentu, periksaSMBV(1/2/3)Sessionsmetrik. Jika ada banyak klien yang terhubung, Anda mungkin perlu menambahkan lebih banyak RAM ke gateway file Anda.

Anda tidak melihat file di sistem file Amazon FSx

Jika Anda melihat bahwa file di gateway tidak tercermin dalam sistem file Amazon FSx, periksaFilesFailingUploadmetrik. Jika metrik melaporkan bahwa beberapa file gagal diunggah, periksa pemberitahuan kesehatan Anda. Ketika file gagal diunggah, gateway akan menghasilkan pemberitahuan kesehatan yang berisi rincian lebih lanjut tentang masalah ini.

Gateway Anda lambat mentransfer data ke Amazon FSx

Jika gateway file Anda lambat mentransfer data ke Amazon S3, lakukan hal berikut:

  • JikaCachePercentDirtymetrik 80 atau lebih besar, gateway file Anda menulis data lebih cepat ke disk daripada dapat mengunggah data ke Amazon S3. Pertimbangkan untuk meningkatkan bandwidth untuk diunggah dari gateway file Anda, menambahkan satu atau lebih disk cache, atau memperlambat penulisan klien.

  • JikaCachePercentDirtymetrik rendah, periksaIoWaitPercentmetrik. JikaIoWaitPercentlebih besar dari 10, file gateway Anda mungkin bottlenecked oleh kecepatan disk cache lokal. Kami merekomendasikan disk solid state drive (SSD) lokal untuk cache Anda, sebaiknya NVM Express (NVMe). Jika disk tersebut tidak tersedia, coba gunakan beberapa disk cache dari disk fisik terpisah untuk peningkatan kinerja.

Pekerjaan cadangan gateway Anda gagal atau ada kesalahan saat menulis ke gateway Anda

Jika pekerjaan cadangan gateway file Anda gagal atau ada kesalahan saat menulis ke gateway file Anda, lakukan hal berikut:

  • JikaCachePercentDirtymetrik 90 persen atau lebih besar, gateway file Anda tidak dapat menerima penulisan baru ke disk karena tidak ada cukup ruang yang tersedia pada disk cache. Untuk melihat seberapa cepat file gateway Anda mengunggah ke Amazon FSx atau Amazon S3, lihatCloudBytesUploadedmetrik. Bandingkan metrik itu denganWriteBytesmetrik, yang menunjukkan seberapa cepat klien menulis file ke file gateway Anda. Jika gateway file Anda menulis lebih cepat daripada yang dapat diunggah ke Amazon FSx atau Amazon S3, tambahkan lebih banyak disk cache untuk menutupi ukuran pekerjaan cadangan seminimal mungkin. Atau, tingkatkan bandwidth upload.

  • Jika pekerjaan cadangan gagal tetapiCachePercentDirtymetrik kurang dari 80 persen, gateway file Anda mungkin menekan timeout sesi sisi klien. Untuk SMB, Anda dapat meningkatkan batas waktu ini menggunakan perintah PowerShellSet-SmbClientConfiguration -SessionTimeout 300. Menjalankan perintah ini menetapkan batas waktu untuk 300 detik.

    Untuk NFS, pastikan bahwa klien dipasang menggunakan hard mount bukan soft mount.