主要儲存使用率平衡檔案伺服器和磁碟效能使用率不平衡將 CloudWatch 維度映射至 ONTAP CLI 和 REST API 資源重新平衡用戶端重新平衡磁碟區

平衡跨 HA 對的工作負載

如果您有具有多個高可用性 (HA) 對的檔案系統，則其輸送量和儲存體會分散到每個 HA 對。FSx for ONTAP 會在檔案系統寫入檔案時自動平衡檔案，但您的工作負載資料和 I/O 在您新增 HA 對後不再平衡。此外，在極少數情況下，您的工作負載資料或 I/O 在檔案系統的現有 HA 對之間可能會變得不平衡，這可能會影響工作負載的整體效能。如果您的工作負載曾經不平衡，您可以重新平衡每個檔案系統的 HA 對（及其對應的檔案伺服器和彙總，也就是構成主要儲存層的儲存集區）。

主題

主要儲存使用率平衡
檔案伺服器和磁碟效能使用率不平衡
將 CloudWatch 維度映射至 ONTAP CLI 和 REST API 資源
重新平衡用戶端
重新平衡磁碟區

主要儲存使用率平衡

檔案系統的主要儲存容量會平均分配到儲存集區中稱為彙總的每個 HA 對。每個 HA 對都有一個彙總。我們建議您持續維持主要儲存層的平均使用率不高於 80%。對於具有多個 HA 對的檔案系統，我們建議您為每個彙總維持高達 80% 的平均使用率。

維持 80% 的使用率可確保新傳入資料有可用空間，並維持維護操作正常的額外負荷，可暫時取得彙總的可用空間。

如果您發現彙總不平衡，您可以增加檔案系統的主要儲存容量（相對增加每個彙總的儲存容量），也可以在彙總之間移動磁碟區。如需詳細資訊，請參閱在彙總之間移動磁碟區。

檔案伺服器和磁碟效能使用率不平衡

檔案系統的整體效能功能（例如網路輸送量、檔案伺服器到磁碟輸送量和 IOPS，以及磁碟 IOPS) 會平均分配到檔案系統的 HA 對。我們建議您持續維持所有效能限制的平均使用率低於 50% （最高尖峰使用率低於 80%)，這適用於所有 HA 對的檔案系統檔案伺服器資源的整體使用率，以及每個檔案伺服器的整體使用率。

如果您注意到檔案伺服器效能使用率不平衡，且工作負載不平衡的檔案伺服器持續使用率超過 80%，您可以使用 ONTAP CLI 和 REST API 進一步診斷效能不平衡的原因並進行修復。以下是可能不平衡指標的表格，以及進一步診斷的後續步驟。

如果您的檔案系統的...	Then...
檔案伺服器磁碟輸送量或檔案伺服器磁碟 IOPS 不平衡	您可能會遇到 HA 對子集（磁碟區的一部分，其中包含所存取的資料量過大）的 I/O 熱點，這可能會限制工作負載的整體效能，因為它對 HA 對子集造成瓶頸。對於每個高度使用的檔案伺服器，請檢查最常使用的磁碟區，以查看哪些磁碟區在彙總中具有最多的活動。如需此程序的詳細資訊，請參閱重新平衡磁碟區。
網路輸送量不平衡，但您的檔案伺服器磁碟輸送量、檔案伺服器磁碟 IOPS 或磁碟 IOPS 不平衡	您的資料會平均分散到 HA 對，但您的用戶端則不是。對於網路輸送量使用率高於其他的檔案伺服器，請檢查每個檔案伺服器的最高用戶端，然後從這些用戶端卸載任何磁碟區，並在不同的 HA 對上使用不同的端點重新掛載這些用戶端，以重新平衡這些用戶端。如需此程序的詳細資訊，請參閱重新平衡用戶端。

如果您的檔案系統的...

Then...

檔案伺服器磁碟輸送量或檔案伺服器磁碟 IOPS 不平衡

您可能會遇到 HA 對子集（磁碟區的一部分，其中包含所存取的資料量過大）的 I/O 熱點，這可能會限制工作負載的整體效能，因為它對 HA 對子集造成瓶頸。對於每個高度使用的檔案伺服器，請檢查最常使用的磁碟區，以查看哪些磁碟區在彙總中具有最多的活動。如需此程序的詳細資訊，請參閱重新平衡磁碟區。

網路輸送量不平衡，但您的檔案伺服器磁碟輸送量、檔案伺服器磁碟 IOPS 或磁碟 IOPS 不平衡

您的資料會平均分散到 HA 對，但您的用戶端則不是。對於網路輸送量使用率高於其他的檔案伺服器，請檢查每個檔案伺服器的最高用戶端，然後從這些用戶端卸載任何磁碟區，並在不同的 HA 對上使用不同的端點重新掛載這些用戶端，以重新平衡這些用戶端。如需此程序的詳細資訊，請參閱重新平衡用戶端。

將 CloudWatch 維度映射至 ONTAP CLI 和 REST API 資源

您的第二代檔案系統具有 FileServer或 Aggregate維度的 Amazon CloudWatch 指標。為了進一步診斷不平衡情況，您需要將這些維度值映射到 ONTAP CLI 或 REST API 中的特定檔案伺服器（或節點) 和彙總。

對於檔案伺服器，每個檔案伺服器名稱都會映射到 ONTAP 中的檔案伺服器（或節點）名稱（例如 FsxId01234567890abcdef-01)。奇數編號的檔案伺服器是偏好的檔案伺服器（也就是，除非檔案系統容錯移轉至次要檔案伺服器，否則它們會服務流量），而偶數編號的檔案伺服器是次要檔案伺服器（也就是，只有在其合作夥伴無法使用時才會提供流量）。因此，次要檔案伺服器通常會比偏好的檔案伺服器顯示較少的使用率。
對於彙總，每個彙總名稱都會映射到 ONTAP 中的彙總（例如 aggr1)。每個 HA 對都有一個彙總，這表示彙總aggr1由 HA 對中的檔案伺服器 FsxId01234567890abcdef-01（作用中檔案伺服器）和 FsxId01234567890abcdef-02（次要檔案伺服器）共用，彙總由檔案伺服器 FsxId01234567890abcdef-03和 aggr2共用FsxId01234567890abcdef-04，以此類推。

您可以使用 ONTAP CLI 檢視所有彙總和檔案伺服器之間的映射。

若要將 SSH 插入檔案系統的 NetApp ONTAP CLI，請遵循《Amazon FSx for NetApp ONTAP 使用者指南》中的使用 NetApp ONTAP CLI區段中記載的步驟。
```
ssh fsxadmin@file-system-management-endpoint-ip-address
```

使用儲存彙總 show 命令，指定 -fields node 參數。


::> storage aggregate show -fields node
aggregate                       node                      
------------------------------- ------------------------- 
aggr1                           FsxId01234567890abcdef-01
aggr2                           FsxId01234567890abcdef-03
aggr3                           FsxId01234567890abcdef-05 
aggr4                           FsxId01234567890abcdef-07
aggr5                           FsxId01234567890abcdef-09
aggr6                           FsxId01234567890abcdef-11 
6 entries were displayed.

重新平衡用戶端

新增 HA 對後，或者如果您在檔案伺服器之間遇到 I/O 不平衡（特別是網路輸送量使用率），您可以重新平衡用戶端。如果您在新增 HA 對後重新平衡用戶端，您可以跳至重新掛載用戶端。否則，您應該先識別要移動的高流量用戶端，以重新平衡工作負載 I/O。

如果您在檔案伺服器之間遇到 I/O 不平衡（特別是網路輸送量使用率），則高 I/O 用戶端可能是原因。若要識別高流量用戶端，請使用 ONTAP CLI。

識別高流量用戶端

若要 SSH 至檔案系統的 NetApp ONTAP CLI，請遵循《Amazon FSx for NetApp ONTAP 使用者指南》中的使用 NetApp ONTAP CLI區段中記載的步驟。
```
ssh fsxadmin@file-system-management-endpoint-ip-address
```
若要檢視最高流量的用戶端，請使用統計資料頂端用戶端 show ONTAP CLI 命令。您可以選擇指定 -node 參數，只檢視特定檔案伺服器的熱門用戶端。如果您診斷特定檔案伺服器的不平衡，請使用 -node 參數，node_name將取代為檔案伺服器的名稱（例如 FsxId01234567890abcdef-01)。

您可以選擇性地新增 -interval 參數，提供輸出每個報告前要測量的間隔（以秒為單位）。增加間隔（例如，增加到最多 300 秒）可為驅動到每個磁碟區的流量提供長期範例。預設值為 5（秒）。
```
::> statistics top client show -node FsxId01234567890abcdef-01 [-interval [5,300]]
```
在輸出中，最高用戶端會以其 IP 地址和連接埠顯示。
```
                                                       *Total     Total
            Client   Vserver          Node                Ops     (Bps)
------------------ --------- ------------------------- ------ ---------
 172.17.236.53:938 svm01     FsxId01234567890abcdef-01   2143 140443648
172.17.236.160:898 svm02     FsxId01234567890abcdef-01    812  53215232
```

重新掛載用戶端

您可以重新平衡用戶端到其他 HA 對。若要這樣做，請從用戶端卸載磁碟區，並使用 SVM NFS/SMB 端點的 DNS 名稱重新掛載磁碟區，這會傳回對應於隨機 HA 對的隨機端點。

我們建議您重複使用 DNS 名稱，但您可以選擇明確選擇指定用戶端掛載的 HA 對。若要保證您將用戶端掛載到不同的端點，您可以改為指定與對應到發生高流量的檔案伺服器不同的端點 IP 地址。您可以執行下列命令來執行此操作：
```
::> network interface show -vserver svm_name -lif nfs_smb_management* -fields address,curr-node
vserver   lif                  address      curr-node                 
--------- -------------------- ------------ ------------------------- 
svm01 nfs_smb_management_1 172.31.15.89 FsxId01234567890abcdef-01 
svm01 nfs_smb_management_3 172.31.8.112 FsxId01234567890abcdef-03 
2 entries were displayed.
```
根據 statistics top client show命令的範例輸出，用戶端172.17.236.53正在將高流量驅動到 FsxId01234567890abcdef-01。network interface show 命令的輸出指出這是地址 172.31.15.89。若要掛載到不同的端點，請選取任何其他地址（在此範例中，唯一的其他地址是 172.31.8.112，對應於 FsxId01234567890abcdef-03)。

重新平衡磁碟區

如果您在磁碟區或彙總中遇到 I/O 不平衡，您可以重新平衡磁碟區，以將 I/O 流量重新分配到磁碟區。

注意

如果您在彙總中遇到儲存使用率不平衡，通常不會對效能造成任何影響，除非高使用率與 I/O 不平衡結合。雖然您可以在彙總之間移動磁碟區以平衡儲存使用率，但我們建議您只在看到效能影響時移動磁碟區，因為如果您不考慮將 I/O 驅動到您考慮移動的每個磁碟區，移動磁碟區可能會對效能產生負面影響。

若要 SSH 至檔案系統的 NetApp ONTAP CLI，請遵循《Amazon FSx for NetApp ONTAP 使用者指南》中的使用 NetApp ONTAP CLI一節中記載的步驟。
```
ssh fsxadmin@file-system-management-endpoint-ip-address
```

使用統計資料磁碟區 show ONTAP CLI 命令來檢視指定彙總的最高流量磁碟區，但有下列變更：

將 aggregate_name 取代為彙總的名稱（例如，aggr1)。
您可以選擇性地新增 -interval 參數，提供輸出每個報告前要測量的間隔（以秒為單位）。增加間隔（例如，增加到最多 300 秒）可為驅動到每個磁碟區的流量提供長期範例。預設值為 5（秒）。


::> statistics volume show -aggregate aggregate_name -sort-key total_ops [-interval [5,300]]

根據您選擇的間隔，最多可能需要 5 分鐘才能顯示資料。此命令會顯示彙總中的所有磁碟區，以及要驅動至每個彙總的流量。


                             *Total Read Write Other      Read Write Latency 
    Volume Vserver Aggregate    Ops  Ops   Ops   Ops     (Bps) (Bps)    (us) 
---------- ------- --------- ------ ---- ----- ----- --------- ----- ------- 
vol1__0007    svm1     aggr1   4078 4078     0     0 267255808     0    1092 
vol1__0005    svm1     aggr1   4078 4078     0     0 267255808     0    1086 
vol1__0003    svm1     aggr1   4077 4077     0     0 267223040     0    1086 
vol1__0001    svm1     aggr1   4077 4077     0     0 267239424     0    1087 
vol1__0008    svm1     aggr2   2314 2314     0     0 151650304     0    1112 
vol1__0006    svm1     aggr2   2144 2144     0     0 140509184     0    1104 
vol1__0002    svm1     aggr2   2183 2183     0     0 143065088     0    1106 
vol1__0004    svm1     aggr2   2183 2183     0     0 143065088     0    1103

磁碟區統計資料是以每個成分為基礎（例如， vol1__0015 是的第 15 個成分vol1) FlexGroup 顯示。您可以從範例輸出中看到，的元件比的元件使用率aggr1更高aggr2。若要平衡彙總之間的流量，您可以在彙總之間移動組成磁碟區，以便更平均地分配流量。

如果您已新增新的 HA 對，則應該將現有的磁碟區移至新的彙總。如需詳細資訊，請參閱在彙總之間移動磁碟區。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

新增 HA 對

管理 NVMe 快取