파일 게이트웨이 문제 해결 - AWSStorage Gateway

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

파일 게이트웨이 문제 해결

VMware vSphere HA (고가용성) 를 실행할 때 Amazon CloudWatch 로그 그룹을 사용하여 파일 게이트웨이를 구성할 수 있습니다. 이 경우 파일 게이트웨이의 상태 및 파일 게이트웨이에서 발생한 오류에 대한 알림을 받습니다. 이러한 오류 및 상태 알림에 대한 정보는 CloudWatch Logs 로그에서 찾을 수 있습니다.

이 단원에서는 각 오류의 원인 및 상태 알림과 문제 해결 방법을 이해하는 데 도움이 되는 정보를 찾을 수 있습니다.

오류: ObjectMissing

당신은 얻을 수 있습니다ObjectMissing지정된 파일 게이트웨이 이외의 쓰기가 Amazon FSx에서 지정된 파일을 삭제할 때 오류가 발생합니다. 이후에 Amazon FSx로 업로드하거나 Amazon FSx에서 객체를 가져오는 작업이 모두 실패합니다.

ObjectMissing 오류를 해결하려면
  1. SMB 클라이언트의 로컬 파일 시스템에 파일의 최신 복사본을 저장합니다 (3단계에서 이 파일 사본이 필요함).

  2. SMB 클라이언트를 사용하여 파일 게이트웨이에서 파일을 삭제합니다.

  3. SMB 클라이언트를 사용하여 1단계에서 저장한 파일의 최신 버전을 Amazon FSx에서 저장한 파일을 SMB 클라이언트를 사용하여 복사합니다. 파일 게이트웨이를 통해 이 작업을 합니다.

알림: 재부팅

게이트웨이 VM을 다시 시작할 때 재부팅 알림을 받을 수 있습니다. VM 하이퍼바이저 관리 콘솔 또는 Storage Gateway 콘솔을 사용하여 게이트웨이 VM을 다시 시작할 수 있습니다. 게이트웨이의 유지 관리 주기 동안 게이트웨이 소프트웨어를 사용하여 다시 시작할 수도 있습니다.

재부팅이 게이트웨이에서 구성된 유지 관리 시작 시간 10분 이내에 수행되는 경우 이 재부팅은 정상적인 현상일 수 있으며 문제의 징조가 아닙니다. 유지 관리 기간을 크게 벗어나 재부팅이 수행된 경우 게이트웨이가 수동으로 다시 시작되었는지 확인합니다.

알림: HardReboot

게이트웨이 VM이 예기치 않게 다시 시작될 때 HardReboot 알림을 받을 수 있습니다. 이러한 다시 시작의 원인은 정전, 하드웨어 오류 또는 다른 이벤트일 수 있습니다. VMware 게이트웨이의 경우 vSphere 고가용성 애플리케이션 모니터링을 통해 재설정하면 이 이벤트가 트리거될 수 있습니다.

게이트웨이가 이러한 환경에서 실행되는 경우 HealthCheckFailure 알림이 있는지 확인하고 VM에 대한 VMware 이벤트 로그를 참조하십시오.

알림: HealthCheckFailure

VMware vSphere HA에 대한 게이트웨이의 경우 상태 확인에 실패하고 VM 다시 시작을 요청하면 HealthCheckFailure 알림을 받을 수 있습니다. 이 이벤트는 AvailabilityMonitorTest 알림으로 표시된 가용성을 모니터하기 위한 테스트 도중에도 발생합니다. 이 경우 HealthCheckFailure 알림이 예상됩니다.

참고

이 알림은 VMware 게이트웨이에만 적용됩니다.

AvailabilityMonitorTest 알림 없이 이 이벤트가 반복적으로 발생하면 VM 인프라(스토리지, 메모리 등)에 문제가 있는지 확인하십시오. 추가 지원이 필요한 경우 문의하십시오.AWS Support.

알림: AvailabilityMonitorTest

당신은AvailabilityMonitorTest본인의 경우 알림테스트 실행가용성 및 애플리케이션 모니터링VMware vSphere HA 플랫폼에서 실행되는 게이트웨이의 시스템입니다.

오류: RoleTrustRelationshipInvalid

파일 공유에 대한 IAM 역할에 잘못 구성된 IAM 신뢰 관계가 있는 경우 (즉, IAM 역할이 이라는 Storage Gateway 보안 주체를 신뢰하지 않는 경우) 이 오류가 발생합니다.storagegateway.amazonaws.com). 따라서 파일 게이트웨이는 파일 공유를 지원하는 S3 버킷에서 작업을 실행하기 위한 자격 증명을 가져올 수 없습니다.

RoleTrustRelationshipInvalid 오류를 해결하려면

CloudWatch 지표를 이용한 문제 해결

Storage Gateway 함께 Amazon CloudWatch 지표를 사용하여 문제를 해결하는 작업에 대한 다음 정보를 찾을 수 있습니다.

디렉토리를 탐색할 때 게이트웨이가 느리게 반응합니다.

를 실행할 때 파일 게이트웨이가 느리게 반응하는 경우ls명령 또는 디렉토리 찾아보기,IndexFetchIndexEvictionCloudWatch 지표:

  • 만약IndexFetch를 실행할 때 지표가 0보다 큽니다.ls명령 또는 찾아보기 디렉터리, 파일 게이트웨이는 영향을 받은 디렉터리 콘텐츠에 대한 정보 없이 시작했으며 Amazon S3 액세스해야 했습니다. 해당 디렉터리의 콘텐츠를 나열하려는 후속 노력이 더 빨리 이루어져야 합니다.

  • 만약IndexEviction지표가 0보다 크면 파일 게이트웨이가 해당 시점에 캐시에서 관리할 수 있는 항목 한계에 도달했음을 의미합니다. 이 경우 파일 게이트웨이는 새 디렉터리를 나열하기 위해 가장 이전에 액세스한 디렉터리에서 일부 스토리지 공간을 비워야 합니다. 이 문제가 자주 발생하고 성능에 영향을 주는 경우 문의하십시오.AWS Support.

    와 토론AWS Support관련 Amazon FSx 파일 시스템의 내용과 사용 사례에 따라 성능을 향상시킬 수 있는 권장 조치에 대한 설명

게이트웨이가 응답하지 않는 경우

파일 게이트웨이가 응답하지 않는 경우 다음을 수행합니다.

  • 최근 재부팅 또는 소프트웨어 업데이트가 있었다면 IOWaitPercent 지표를 확인하십시오. 이 지표는 처리되지 않은 디스크 I/O 요청이 있을 때 CPU가 유휴 상태인 시간의 백분율을 보여줍니다. 경우에 따라 이 값이 높고(10 이상) 서버가 재부팅되거나 업데이트된 후에 증가했을 수 있습니다. 이 경우 인덱스 캐시를 RAM으로 재구성함에 따라 느린 루트 디스크로 인해 파일 게이트웨이에 병목 현상이 발생할 수 있습니다. 루트 디스크에 더 빠른 물리적 디스크를 사용하여 이 문제를 해결할 수 있습니다.

  • 만약MemUsedBytes메트릭은 다음과 거의 같거나 거의 같습니다.MemTotalBytes지표를 선택하면 파일 게이트웨이에 사용 가능한 RAM이 부족해집니다. 파일 게이트웨이에 필요한 최소 RAM이 있는지 확인합니다. 이미 이를 확인했다면 워크로드 및 사용 사례에 따라 파일 게이트웨이에 RAM을 추가해 보십시오.

    파일 공유가 SMB인 경우 파일 공유에 연결된 SMB 클라이언트 수 때문일 수도 있습니다. 지정된 시간에 연결된 클라이언트 수를 확인하려면 SMBV(1/2/3)Sessions 지표를 확인합니다. 연결된 클라이언트가 많은 경우 파일 게이트웨이에 RAM을 더 추가해야 할 수 있습니다.

Amazon FSx 파일 시스템에 파일이 표시되지 않습니다.

게이트웨이의 파일이 Amazon FSx 파일 시스템에 반영되지 않는 경우FilesFailingUpload지표. 지표가 일부 파일 업로드에 실패했다고 보고하는 경우 상태 알림을 확인합니다. 파일 업로드에 실패하면 게이트웨이가 문제에 대한 자세한 내용을 포함하는 상태 알림을 생성합니다.

게이트웨이가 Amazon FSx로 데이터를 전송하는 속도가 느립니다.

파일 게이트웨이에서 Amazon S3 데이터를 전송하는 속도가 느린 경우 다음을 수행합니다.

  • 만약CachePercentDirty지표가 80 이상인 경우 파일 게이트웨이는 데이터를 Amazon S3 업로드할 수 있는 것보다 더 빨리 디스크에 데이터를 쓰고 있습니다. 파일 게이트웨이에서 업로드를 위한 대역폭을 늘리거나, 캐시 디스크를 하나 이상 추가하거나, 클라이언트 쓰기 속도를 늦추는 것이 좋습니다.

  • 만약CachePercentDirty지표가 낮은 경우IoWaitPercent지표. 다음의 경우,IoWaitPercent가 10보다 큰 경우 파일 게이트웨이가 로컬 캐시 디스크의 속도로 인해 병목 현상이 발생할 수 있습니다. 캐시에 로컬 SSD(Solid State Drive) 디스크를 사용하는 것이 좋습니다. 추천 제품은 NVMe(NVM Express)입니다. 이러한 디스크를 사용할 수 없는 경우 성능 향상을 위해 별도의 물리적 디스크에서 여러 캐시 디스크를 사용해 보십시오.

게이트웨이 백업 작업이 실패하거나 게이트웨이에 쓸 때 오류가 발생하는 경우

파일 게이트웨이 백업 작업이 실패하거나 파일 게이트웨이에 쓸 때 오류가 발생하는 경우 다음을 수행합니다.

  • 만약CachePercentDirty지표가 90% 이상이면 캐시 디스크에 사용 가능한 공간이 부족하기 때문에 파일 게이트웨이가 디스크에 대한 새 쓰기를 허용할 수 없습니다. Amazon FSx 또는 Amazon S3에 파일 게이트웨이가 업로드하는 속도를 확인하려면CloudBytesUploaded지표. 해당 메트릭과 비교WriteBytesmetric - 클라이언트가 파일 게이트웨이에 파일을 쓰는 속도를 보여 줍니다. 파일 게이트웨이가 Amazon FSx 또는 Amazon S3에 업로드할 수 있는 것보다 빨리 쓰는 경우 최소한 백업 작업의 크기를 처리할 수 있도록 캐시 디스크를 더 추가합니다. 또는 업로드 대역폭을 늘립니다.

  • 백업 작업이 실패하지만CachePercentDirty지표가 80% 미만인 경우 파일 게이트웨이가 클라이언트 측 세션 제한 시간에 도달했을 수 있습니다. SMB의 경우 PowerShell 명령 Set-SmbClientConfiguration -SessionTimeout 300을 사용하여 이 제한 시간을 늘릴 수 있습니다. 이 명령을 실행하면 이 제한 시간이 300초로 설정됩니다.

    NFS의 경우 소프트 마운트 대신 하드 마운트를 사용하여 클라이언트를 마운트해야 합니다.