疑難排解檔案系統掛載問 - FSx for Lustre

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

疑難排解檔案系統掛載問

檔案系統掛載指令失敗時,有許多潛在原因,如下列主題所述。

檔案系統立即掛載失敗

檔案系統掛載指令會立即失敗。下列代碼顯示了範例。

mount.lustre: mount fs-0123456789abcdef0.fsx.us-east-1.aws@tcp:/fsx at /lustre failed: No such file or directory Is the MGS specification correct? Is the filesystem name correct?

如果您在使用mount命令掛載持續性或暫存 2 檔案系統時未使用正確的mountname值,就會發生此錯誤。您可以從describe-file-systemsAWS CLI命令的響應或 DescribeFileSystemsAPI 操作中獲取mountname值。

檔案系統掛載停止回應,然後因逾時錯誤而失敗

檔案系統掛載命令停止回應一至兩分鐘,然後因逾時錯誤而失敗。

下列代碼顯示了範例。

sudo mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx [2+ minute wait here] Connection timed out

發生此錯誤的原因是 Amazon EC2 執行個體或檔案系統的安全群組未正確設定。

採取動作

請確定檔案系統的安全性群組具有中指定的輸入規則Amazon VPC 安全群組

自動掛載失敗且執行個體沒有回應

在某些情況下,檔案系統的自動掛載可能會失敗,且 Amazon EC2 執行個體可能會停止回應。

如果未宣告此_netdev選項,則可能會發生此問題。如果_netdev遺失,您的 Amazon EC2 執行個體可能會停止回應。此結果是因為網路檔案系統在運算執行個體開始聯網後需要初始化。

採取動作

如果發生此問題,請聯絡AWS Support。

系統開機期間,檔案系統掛載失敗

在系統開機期間,檔案系統掛載失敗。安裝是使用自動化的/etc/fstab。當未掛載檔案系統時,系統記錄會在執行個體開機時間範圍內看到下列錯誤。

LNetError: 3135:0:(lib-socket.c:583:lnet_sock_listen()) Can't create socket: port 988 already in use LNetError: 122-1: Can't start acceptor on port 988: port already in use

當連接埠 988 無法使用時,可能會發生此錯誤。當執行個體設定為掛載 NFS 檔案系統時,NFS 掛載可能會將其用戶端連接埠繫結至連接埠 988

採取動作

您可以盡可能調整 NFS 用戶端noresvportnoauto掛載選項來解決此問題。

使用 DNS 名稱掛載檔案系統失敗

設定錯誤的網域名稱服務 (DNS) 名稱可能會造成檔案系統掛載失敗,如下列案例所示。

例 1:使用網域名稱服務 (DNS) 名稱的檔案系統掛載失敗。下列代碼顯示了範例。

sudo mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx mount.lustre: Can't parse NID 'file_system_dns_name@tcp:/mountname'

採取動作

檢查您的虛擬私有雲 (VPC) 設定。如果您使用的是自訂 VPC,請確保 DNS 設定已啟用。如需詳細資訊,請參閱《Amazon VPC 使用者指南》中的 使用 DNS 與您的 VPC 搭配

若要在mount命令中指定 DNS 名稱,請執行下列動作:

  • 確保 Amazon EC2 執行個體與您的 Amazon FSx 版 Lustre 檔案系統位於相同的 VPC 中。

  • 在設定為使用 Amazon 提供的 DNS 伺服器的 VPC 內 Connect 您的 Amazon EC2 執行個體。如需詳細資訊,請參閱《Amazon VPC 使用者指南》中的 DHCP 選項集

  • 確保連接的 Amazon EC2 執行個體的亞馬遜 VPC 已啟用 DNS 主機名稱。如需詳細資訊,請參閱 Amazon VPC 使用者指南中的更新虛擬私人雲端的 DNS Support

例 2:使用網域名稱服務 (DNS) 名稱的檔案系統掛載失敗。下列代碼顯示了範例。

mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx mount.lustre: mount file_system_dns_name@tcp:/mountname at /mnt/fsx failed: Input/output error Is the MGS running?

採取動作

確定用戶端的 VPC 安全性群組套用了正確的輸出流量規則。此建議適用,尤其是當您未使用預設安全性群組,或您已修改預設安全性群組時。如需詳細資訊,請參閱Amazon VPC 安全群組