Amazon FSx 檔案閘道不再提供給新客戶。FSx File Gateway 的現有客戶可以繼續正常使用服務。如需類似 FSx File Gateway 的功能,請造訪此部落格文章
本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
故障診斷:檔案閘道問題
您可以設定檔案閘道,將日誌項目寫入 Amazon CloudWatch 日誌群組。如果您這樣做,您會收到有關閘道運作狀態和閘道遇到之任何錯誤的通知。您可以在 CloudWatch Logs 中找到這些錯誤和運作狀態通知的相關資訊。
在下列各節,您可以找到相關資訊,協助您了解每個錯誤的原因、運作狀態通知,以及修正問題的方法。
主題
錯誤:FileMissing
FileMissing
錯誤類似於ObjectMissing
錯誤,解決錯誤的步驟相同。當指定檔案閘道以外的寫入器從 Amazon FSx 刪除指定的檔案時,您可能會收到FileMissing
錯誤。任何後續上傳至 Amazon FSx 或從 Amazon FSx 擷取物件都會失敗。
解決 FileMissing 錯誤
-
將檔案的最新副本儲存至 SMB 用戶端的本機檔案系統 (您需要在步驟 3 中使用此檔案副本)。
-
使用 SMB 用戶端從檔案閘道刪除檔案。
-
使用 SMB 用戶端複製您在步驟 1 Amazon FSx 中儲存的最新版本檔案。透過您的檔案閘道執行此操作。
錯誤:FsxFileSystemAuthenticationFailure
當附加檔案系統時提供的登入資料過期,或其權限已撤銷時,您可能會收到FsxFileSystemAuthenticationFailure
錯誤。
解決 FsxFileSystemAuthenticationFailure 錯誤
-
確定連接 Amazon FSx 檔案系統時提供的登入資料仍然有效。
-
確定使用者擁有所有必要的許可,如連接 Amazon FSx for Windows File Server 檔案系統所述。
錯誤:FsxFileSystemConnectionFailure
當無法從閘道機器存取 Amazon FSx 伺服器時,您可能會收到FsxFileSystemConnectionFailure
錯誤。
解決 FsxFileSystemConnectionFailure 錯誤
-
確保所有防火牆和 VPC 規則允許閘道機器和 Amazon FSx 伺服器之間的連線。
-
確保 Amazon FSx 伺服器正在執行。
錯誤:FsxFileSystemFull
當 Amazon FSx 檔案系統中沒有足夠的可用磁碟空間時,您可能會收到FsxFileSystemFull
錯誤。
解決 FsxFileSystemFull 錯誤
-
增加 Amazon FSx 檔案系統的儲存空間。
錯誤:GatewayClockOutOfSync
當閘道偵測到本機系統時間和 AWS Storage Gateway伺服器報告的時間之間有 5 分鐘或更多的差異時,您可能會收到GatewayClockOutOfSync
錯誤。時鐘同步問題可能會對閘道與 之間的連線產生負面影響 AWS。如果閘道時鐘不同步,NFS 和 SMB 連線可能會發生 I/O 錯誤,而 SMB 使用者可能會發生身分驗證錯誤。
解決 GatewayClockOutOfSync 錯誤
-
檢查閘道和 NTP 伺服器之間的網路組態。如需同步閘道 VM 時間和更新 NTP 伺服器組態的詳細資訊,請參閱為您的閘道設定網路時間協定 (NTP) 伺服器。
錯誤:InvalidFileState
當指定閘道以外的寫入器修改指定檔案共享中的指定檔案時,您可能會收到InvalidFileState
錯誤。因此,閘道上檔案的狀態與 Amazon FSx 中的狀態不相符。後續從 Amazon FSx 上傳或擷取檔案可能會失敗。
解決 InvalidFileState 錯誤
-
將檔案的最新副本儲存至 SMB 用戶端的本機檔案系統 (您需要此檔案才能在步驟 4 中複製)。如果 Amazon FSx 中的 檔案版本是最新版本,請下載該版本。您可以使用任何 SMB 用戶端直接存取 Amazon FSx 共用來執行此操作。
-
直接刪除 Amazon FSx 中的檔案。
-
使用 SMB 用戶端從閘道刪除檔案。
-
使用您的 SMB 用戶端,透過檔案閘道將您在步驟 1 中儲存的最新版本檔案複製到 Amazon FSx。
錯誤:ObjectMissing
當指定檔案閘道以外的寫入器從 Amazon FSx 刪除指定的檔案時,您可能會收到ObjectMissing
錯誤。任何後續上傳至 Amazon FSx 或從 Amazon FSx 擷取物件失敗。
解決 ObjectMissing 錯誤
-
將檔案的最新副本儲存至 SMB 用戶端的本機檔案系統 (您需要在步驟 3 中使用此檔案副本)。
-
使用 SMB 用戶端從檔案閘道刪除檔案。
-
使用 SMB 用戶端複製您在步驟 1 Amazon FSx 中儲存的最新版本檔案。透過您的檔案閘道執行此操作。
錯誤:DroppedNotifications
當閘道根磁碟上的可用儲存空間小於 1 GB,或在 1 分鐘內產生超過 100 個運作狀態通知時,您可能會看到DroppedNotifications
錯誤,而不是其他預期的 CloudWatch 日誌項目類型。在這些情況下,閘道會停止產生詳細的 CloudWatch 日誌通知做為預防措施。
解決 DroppedNotifications 錯誤
-
檢查 Storage Gateway
Root Disk Usage
主控台中閘道的監控索引標籤上的指標,以判斷可用的根磁碟空間是否不足。 -
如果可用空間小於 1 GB,請增加閘道根儲存磁碟的大小。如需說明,請參閱虛擬機器 Hypervisor 的文件。
若要增加 Amazon EC2 閘道的根磁碟大小,請參閱《Amazon Elastic Compute Cloud 使用者指南》中的請求修改 EBS 磁碟區。
注意
無法增加 AWS Storage Gateway 硬體設備的根磁碟大小。
-
重新啟動您的閘道。
通知:HardReboot
當閘道 VM 意外重新啟動時,您可能會收到 HardReboot
通知。這種重新啟動可能是因為電源中斷、硬體故障或其他事件。對於 VMware 閘道,vSphere 高可用性應用程式監控重設可能會導致此事件。
當閘道在這種環境中執行時,請檢查 HealthCheckFailure
通知是否存在,並參閱 VM 的 VMware 事件記錄。
通知:重新啟動
當閘道 VM 重新啟動時,您可能會收到重新啟動通知。您可以使用 VM Hypervisor Management 主控台或 Storage Gateway 主控台來重新啟動閘道 VM。您也可以在閘道維護週期期間使用閘道軟體來重新啟動。
如果重新啟動的時間在閘道所設定之維護開始時間的 10 分鐘以內,此重新啟動可能是正常的情況,而不是任何問題的徵兆。如果重新啟動很常在維護時段外發生,請檢查閘道是否已手動重新啟動。
故障診斷:Active Directory 網域問題
FSx File Gateway 不會為 Active Directory 網域問題產生特定日誌訊息。如果您在將閘道加入 Active Directory 網域時遇到問題,請執行下列動作:
-
確認閘道並未嘗試使用唯讀網域控制站 (RODC) 加入網域。
-
確認閘道已設定為使用正確的 DNS 伺服器。
例如,如果您嘗試將 Amazon EC2 閘道執行個體加入 AWS受管 Active Directory,請確認 EC2 VPC 的 DHCP 選項集指定受 AWS管 Active Directory DNS 伺服器。
您透過 VPC DHCP 選項集設定的 DNS 伺服器會提供給 VPC 中的所有 EC2 執行個體。如果您想要為個別閘道指定 DNS 伺服器,您可以使用該閘道的 EC2 本機主控台來執行此作業。
對於內部部署閘道,您可以使用 VM 本機主控台指定 DNS 伺服器。
-
從閘道本機主控台的命令提示字元執行下列命令,以確認閘道網路連線。將反白顯示的變數取代為部署中的實際網域名稱和 IP 地址。
dig -d
ExampleDomainName
ncport -dExampleDomainControllerIPAddress
-p 445 ncport -dExampleDomainControllerIPAddress
-p 389 -
確認您的 Active Directory 服務帳戶具有必要的許可。如需詳細資訊,請參閱 Active Directory 服務帳戶許可要求。
-
驗證閘道是否聯結正確的組織單位 (OU)。
加入網域會使用閘道的閘道 ID 做為帳戶名稱 (例如,SGW-1234ADE),在預設的電腦容器 (非 OU) 中建立 Active Directory 電腦帳戶。您無法自訂此帳戶的名稱。
如果您的 Active Directory 環境具有新電腦物件的指定 OU,您必須在加入網域時指定該 OU。
如果您在嘗試加入指定的 OU 時遇到存取遭拒錯誤,請洽詢 Active Directory 網域管理員。管理員可能需要預先設定閘道的電腦帳戶,才能加入網域。如需詳細資訊,請參閱如何針對將 Storage Gateway 檔案閘道加入網域以進行 Microsoft Active Directory 身分驗證的問題進行疑難排解?
。 -
從閘道本機主控台的命令提示字元執行下列命令,確認閘道的主機名稱可在 DNS 中解析。將反白顯示的變數取代為閘道的實際主機名稱。
dig -d
ExampleHostName
-r A如果您已為閘道設定自訂主機名稱,則必須手動新增指向其 IP 地址的 DNS A 記錄。
-
確認閘道與網域控制器之間的網路延遲相當低。如果閘道未在 20 秒內收到來自網域控制器的回應,加入網域的查詢可能會逾時。
如果您使用 JoinDomain CLI 命令將閘道加入網域,您可以新增
--timeout-in-seconds
旗標,將逾時增加到最多 3,600 秒。 -
確認您用來將閘道加入網域的 Active Directory 使用者具有執行此作業所需的權限。
故障診斷:使用 CloudWatch 指標
您可以在下面找到使用 Amazon CloudWatch 指標搭配 Storage Gateway 處理問題之動作的相關資訊。
主題
瀏覽目錄時,您的閘道反應緩慢
如果您的檔案閘道在執行ls命令或瀏覽目錄時反應緩慢,請檢查 IndexFetch
和 IndexEviction
CloudWatch 指標:
-
如果您執行
ls
命令或瀏覽目錄時IndexFetch
,指標大於 0,您的 File Gateway 會啟動,但不提供有關受影響目錄內容的資訊,且必須存取 FSx for Windows File Server。後續列出該目錄內容的動作應會更快完成。 -
如果
IndexEviction
指標大於 0,表示您的檔案閘道已達到當時可在其快取中管理的限制。在這種情況下,您的檔案閘道必須從最近存取最少的目錄釋放一些儲存空間,以列出新的目錄。如果經常發生這種情況且效能受到影響,請聯絡 支援。與相關 Amazon FSx 檔案系統 支援 的內容和建議討論,以根據您的使用案例改善效能。
您的閘道未回應
如果您的檔案閘道沒有回應,請執行下列動作:
-
如果有最近的重新開機或軟體更新,則請查看
IOWaitPercent
指標。此指標會顯示在有未完成磁碟 I/O 請求時 CPU 閒置時間的百分比。在某些情況下,百分比可能偏高 (10 或以上),而且可能已在伺服器重新啟動或更新後上升。在這些情況下,您的檔案閘道可能會在重建索引快取至 RAM 時,受到慢速根磁碟的瓶頸。您可以將速度較快的實體磁碟用於根磁碟來解決此問題。 -
如果
MemUsedBytes
指標與MemTotalBytes
指標等於或幾乎相同,則檔案閘道會用盡可用的 RAM。請確定您的檔案閘道至少具有所需的 RAM 下限。如果已經這麼做,請考慮根據您的工作負載和使用案例,將更多 RAM 新增至檔案閘道。如果檔案共享是 SMB,此問題也可能是因為連線到檔案共享的 SMB 用戶端數目所造成。若要查看在任何指定時間連線的用戶端數目,請檢查
SMBV(1/2/3)Sessions
指標。如果連接了許多用戶端,您可能需要將更多 RAM 新增至檔案閘道。
您在 Amazon FSx 檔案系統中看不到檔案
如果您注意到閘道上的檔案未反映在 Amazon FSx 檔案系統中,請檢查 FilesFailingUpload
指標。如果指標報告某些檔案上傳失敗,請檢查您的運作狀態通知。當檔案上傳失敗時,閘道會產生運作狀態通知,其中包含問題的詳細資訊。
您在 Amazon FSx 檔案系統中看不到較舊的快照
FSx File Gateway 上的某些檔案操作,例如頂層資料夾重新命名或許可變更,可能會導致多個檔案操作,導致 FSx for Windows File Server 檔案系統具有高 I/O 負載。如果您的檔案系統沒有足夠的工作負載效能資源,檔案系統可能會刪除影子複本,因為它會將持續 I/O 的可用性優先於歷史影子複本保留。
在 Amazon FSx 主控台中,檢查監控和效能頁面,查看您的檔案系統是否佈建不足。如果是,您可以切換到 SSD 儲存體、增加輸送量容量或增加 SSD IOPS 來處理工作負載。
您的閘道傳輸資料到 Amazon FSx 的速度緩慢
如果您的檔案閘道將資料傳輸到 Amazon FSx for Windows File Server,請執行下列動作:
-
如果
CachePercentDirty
指標為 80 或更高,您的檔案閘道將資料寫入磁碟的速度會比將資料上傳至 Amazon FSx for Windows File Server 的速度更快。考慮增加從檔案閘道上傳的頻寬、新增一或多個快取磁碟,或減慢用戶端寫入速度,或增加相關聯 Amazon FSx for Windows File Server 的輸送量容量。 -
如果
CachePercentDirty
指標很低,請檢查IoWaitPercent
指標。如果IoWaitPercent
大於 10,您的檔案閘道可能會因為本機快取磁碟的速度而遇到瓶頸。建議將本機固態硬碟 (SSD) 磁碟用於快取,最好是 NVM Express (NVMe)。如果無法取得這種磁碟,請嘗試使用來自個別實體磁碟的多個快取磁碟,以提升效能。
您的閘道備份任務失敗,或寫入閘道時發生錯誤
如果您的檔案閘道備份任務失敗,或寫入檔案閘道時發生錯誤,請執行下列動作:
-
如果
CachePercentDirty
指標為 90% 或更高,您的檔案閘道就無法接受對磁碟的新寫入,因為快取磁碟上沒有足夠的可用空間。若要查看您的檔案閘道上傳到 FSx for Windows File Server 的速度,請檢視CloudBytesUploaded
指標。將該指標與WriteBytes
指標進行比較,該指標顯示用戶端將檔案寫入檔案閘道的速度。如果 SMB 用戶端寫入檔案閘道的速度比上傳至 FSx for Windows File Server 的速度快,請新增更多快取磁碟,以至少涵蓋備份任務的大小。或者,增加上傳頻寬。 -
如果備份任務等大型檔案副本失敗,但
CachePercentDirty
指標低於 80%,您的檔案閘道可能會命中用戶端工作階段逾時。若是 SMB,您可使用 PowerShell 命令Set-SmbClientConfiguration -SessionTimeout 300
來增加此逾時設定。執行此命令會將逾時設為 300 秒。