Bilanciamento dei carichi di lavoro - FSx per ONTAP

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Bilanciamento dei carichi di lavoro

Se disponi di un file system con più coppie ad alta disponibilità (HA), la velocità effettiva e lo storage sono distribuiti su ciascuna delle coppie HA. FSx for ONTAP bilancia automaticamente i file man mano che vengono scritti sul file system, ma i dati del carico di lavoro e l'I/O non sono più bilanciati una volta aggiunte le coppie HA. Inoltre, in rari casi, i dati del carico di lavoro o l'I/O potrebbero sbilanciarsi tra le coppie HA esistenti del file system, il che può influire sulle prestazioni complessive del carico di lavoro. In caso di squilibrio del carico di lavoro, è possibile ribilanciarlo su ciascuna coppia HA del file system (e sui relativi file server e aggregati, i pool di storage che costituiscono il livello di storage principale).

Equilibrio nell'utilizzo dello storage principale

La capacità di storage principale del file system è suddivisa equamente tra ciascuna delle coppie HA in pool di storage denominati aggregati. Ogni coppia HA ha un aggregato. Si consiglia di mantenere un utilizzo medio non superiore all'80% per il livello di storage principale su base continuativa. Per i file system con più coppie HA, si consiglia di mantenere un utilizzo medio fino all'80% per ogni aggregato.

Il mantenimento dell'80% di utilizzo garantisce lo spazio libero per i nuovi dati in entrata e mantiene un buon sovraccarico per le operazioni di manutenzione che possono temporaneamente occupare spazio libero sugli aggregati.

Se notate che gli aggregati sono squilibrati, potete aumentare la capacità di storage principale del file system (aumentando proporzionalmente la capacità di storage di ciascun aggregato) oppure spostare i volumi tra gli aggregati. Per ulteriori informazioni, consulta Spostamento di volumi tra aggregati.

Sbilanciamento tra l'utilizzo di file server e dischi

Le prestazioni totali del file system (ad esempio la velocità effettiva di rete, il throughput e gli IOPS da file server a disco e IOPS su disco) sono suddivise equamente tra le coppie HA del file system. Si consiglia di mantenere un utilizzo medio inferiore al 50% (e un utilizzo di picco massimo inferiore all'80%) per tutti i limiti di prestazioni su base continuativa, sia per l'utilizzo complessivo delle risorse del file server del file system su tutte le coppie HA, sia per il singolo file server.

Se noti che l'utilizzo delle prestazioni del file server è squilibrato e i file server su cui è sbilanciato il carico di lavoro hanno un utilizzo continuo superiore all'80%, puoi utilizzare la CLI di ONTAP e l'API REST per diagnosticare ulteriormente la causa dello squilibrio delle prestazioni e porvi rimedio. Di seguito è riportata una tabella dei possibili indicatori di squilibrio e delle fasi successive per un'ulteriore diagnosi.

Se il tuo file system è... Allora...

La velocità effettiva del disco del file server o gli IOPS del disco del file server non sono bilanciati

È possibile che si verifichi un hotspotting di I/O su un sottoinsieme di coppie HA (un sottoinsieme di volumi contenente una quantità enorme di dati a cui si accede), il che può limitare le prestazioni complessive del carico di lavoro perché è ostacolato rispetto a un sottoinsieme di coppie HA. Per ogni file server molto utilizzato, controlla i volumi più utilizzati per vedere quali sono i volumi con la maggiore attività all'interno di un aggregato. Per ulteriori informazioni su questa procedura, consulta Ribilanciamento dei volumi.

Il throughput di rete non è bilanciato, ma il throughput del disco del file server, gli IOPS del disco del file server o gli IOPS del disco non sono sbilanciati

I tuoi dati sono distribuiti in modo uniforme tra le coppie HA, a differenza dei tuoi client. Per i file server che utilizzano maggiormente il throughput di rete rispetto agli altri, controllate i client principali per ogni file server, quindi ribilanciate i client smontando tutti i volumi di quei client e rimontandoli utilizzando un endpoint diverso su una coppia HA diversa. Per ulteriori informazioni su questa procedura, consulta Ribilanciamento dei client.

Mappatura delle CloudWatch dimensioni alle risorse dell'API REST e della CLI ONTAP

Il tuo file system di seconda generazione ha CloudWatch metriche Amazon con la FileServer dimensione or. Aggregate Per diagnosticare ulteriormente i casi di squilibrio, è necessario mappare questi valori di dimensione su file server (o nodi) e aggregati specifici nella CLI ONTAP o nell'API REST.

  • Per i file server, ogni nome di file server è mappato a un nome di file server (o nodo) in ONTAP (ad esempio,). FsxId01234567890abcdef-01 I file server con numeri dispari sono file server preferiti (ovvero gestiscono il traffico a meno che il file system non abbia effettuato il failover sul file server secondario), mentre i file server con numero pari sono file server secondari (ovvero servono il traffico solo quando il partner non è disponibile). Per questo motivo, i file server secondari in genere mostrano un utilizzo inferiore rispetto ai file server preferiti.

  • Per gli aggregati, ogni nome aggregato viene mappato a un aggregato in ONTAP (ad esempio,). aggr1 Esiste un aggregato per ogni coppia HA, il che significa che l'aggregato aggr1 è condiviso dai file server FsxId01234567890abcdef-01 (il file server attivo) e FsxId01234567890abcdef-02 (il file server secondario) in una coppia HA, l'aggregato aggr2 è condiviso dai file server e così via. FsxId01234567890abcdef-03 FsxId01234567890abcdef-04

È possibile visualizzare le mappature tra tutti gli aggregati e i file server utilizzando la CLI di ONTAP.

  1. Per accedere tramite SSH alla NetApp CLI ONTAP del tuo file system, segui i passaggi documentati nella sezione della Guida per Utilizzo della CLI NetApp ONTAP l'utente di Amazon FSx for ONTAP. NetApp

    ssh fsxadmin@file-system-management-endpoint-ip-address
  2. Utilizza il comando storage aggregate show, specificando il parametro. -fields node

    ::> storage aggregate show -fields node aggregate node ------------------------------- ------------------------- aggr1 FsxId01234567890abcdef-01 aggr2 FsxId01234567890abcdef-03 aggr3 FsxId01234567890abcdef-05 aggr4 FsxId01234567890abcdef-07 aggr5 FsxId01234567890abcdef-09 aggr6 FsxId01234567890abcdef-11 6 entries were displayed.

Ribilanciamento dei client

Dopo aver aggiunto le coppie HA o se riscontri uno squilibrio di I/O tra i file server (in particolare a causa dell'utilizzo del throughput di rete), puoi ribilanciare i client. Se stai ribilanciando i client dopo aver aggiunto le coppie HA, puoi passare a. Rimontaggio dei client Altrimenti, dovresti prima identificare i client ad alto traffico che desideri spostare per ribilanciare l'I/O del carico di lavoro.

Se riscontri uno squilibrio di I/O tra i file server (in particolare con l'utilizzo del throughput di rete), la causa potrebbe essere costituita da client di I/O elevati. Per identificare i client ad alto traffico, utilizza la CLI di ONTAP.

Identifica i client ad alto traffico
  1. Per accedere tramite SSH alla NetApp CLI ONTAP del tuo file system, segui i passaggi documentati nella sezione della Guida per Utilizzo della CLI NetApp ONTAP l'utente di Amazon FSx for ONTAP. NetApp

    ssh fsxadmin@file-system-management-endpoint-ip-address
  2. Per visualizzare i client con il traffico più elevato, utilizzate il comando Statistics top client show ONTAP CLI. Facoltativamente, puoi specificare il -node parametro per visualizzare solo i client principali per un file server specifico. Se state diagnosticando uno squilibrio per un file server specifico, utilizzate il -node parametro, sostituendolo node_name con il nome del file server (ad esempio,). FsxId01234567890abcdef-01

    Facoltativamente, è possibile aggiungere il -interval parametro, fornendo l'intervallo di misurazione (in secondi) prima dell'output di ogni report. L'aumento dell'intervallo (ad esempio, fino a un massimo di 300 secondi) fornisce un campione a lungo termine della quantità di traffico indirizzata verso ciascun volume. L'impostazione predefinita è 5 (secondi).

    ::> statistics top client show -node FsxId01234567890abcdef-01 [-interval [5,300]]

    Nell'output, i client principali vengono visualizzati in base all'indirizzo IP e alla porta.

    *Total Total Client Vserver Node Ops (Bps) ------------------ --------- ------------------------- ------ --------- 172.17.236.53:938 svm01 FsxId01234567890abcdef-01 2143 140443648 172.17.236.160:898 svm02 FsxId01234567890abcdef-01 812 53215232
Rimontaggio dei client
  • È possibile ribilanciare i client con altre coppie HA. A tale scopo, smonta il volume dal client e rimontalo utilizzando il nome DNS per l'endpoint NFS/SMB di SVM: questo restituisce un endpoint casuale corrispondente a una coppia HA casuale.

    Ti consigliamo di riutilizzare il nome DNS, ma hai la possibilità di scegliere esplicitamente quale coppia HA monta un determinato client. Per garantire il montaggio di un client su un endpoint diverso, puoi invece specificare un indirizzo IP dell'endpoint diverso da quello corrispondente al file server che sta registrando un traffico elevato. È possibile farlo eseguendo il comando seguente:

    ::> network interface show -vserver svm_name -lif nfs_smb_management* -fields address,curr-node vserver lif address curr-node --------- -------------------- ------------ ------------------------- svm01 nfs_smb_management_1 172.31.15.89 FsxId01234567890abcdef-01 svm01 nfs_smb_management_3 172.31.8.112 FsxId01234567890abcdef-03 2 entries were displayed.

    In base all'output di esempio del statistics top client show comando, il client 172.17.236.53 sta indirizzando un traffico elevato versoFsxId01234567890abcdef-01. L'output del network interface show comando indica che questo è l'indirizzo172.31.15.89. Per eseguire il montaggio su un dispositivo diverso, selezionate qualsiasi altro indirizzo (in questo esempio, l'unico altro indirizzo è172.31.8.112, corrispondente aFsxId01234567890abcdef-03).

Ribilanciamento dei volumi

Se riscontri uno squilibrio di I/O tra i tuoi volumi o aggregati, puoi ribilanciare i volumi per ridistribuire il traffico di I/O tra i volumi.

Nota

Se si riscontra uno squilibrio nell'utilizzo dello storage tra gli aggregati, in genere non vi è alcun impatto sulle prestazioni a meno che l'elevato utilizzo non sia associato a uno squilibrio di I/O. Sebbene sia possibile spostare i volumi tra gli aggregati per bilanciare l'utilizzo dello storage, consigliamo di spostare i volumi solo se si riscontra un impatto sulle prestazioni, poiché lo spostamento dei volumi può avere un impatto negativo sulle prestazioni se non si considera anche l'I/O determinato da ciascun volume che si intende spostare.

  1. Per accedere tramite SSH alla NetApp CLI ONTAP del tuo file system, segui i passaggi documentati nella sezione della Guida per Utilizzo della CLI NetApp ONTAP l'utente di Amazon FSx for ONTAP. NetApp

    ssh fsxadmin@file-system-management-endpoint-ip-address
  2. Utilizza il comando Statistics Volume Show ONTAP CLI per visualizzare i volumi di traffico più elevati per un determinato aggregato, con le seguenti modifiche:

    • Sostituisci aggregate_name con il nome dell'aggregato (ad esempio,). aggr1

    • Facoltativamente, puoi aggiungere il -interval parametro, fornendo l'intervallo di misurazione (in secondi) prima dell'output di ogni rapporto. L'aumento dell'intervallo (ad esempio, fino a un massimo di 300 secondi) fornisce un campione a lungo termine della quantità di traffico indirizzata verso ciascun volume. L'impostazione predefinita è 5 (secondi).

    ::> statistics volume show -aggregate aggregate_name -sort-key total_ops [-interval [5,300]]

    A seconda dell'intervallo scelto, la visualizzazione dei dati può richiedere fino a 5 minuti. Il comando mostra tutti i volumi dell'aggregato, insieme alla quantità di traffico indirizzata verso ciascun aggregato.

    *Total Read Write Other Read Write Latency Volume Vserver Aggregate Ops Ops Ops Ops (Bps) (Bps) (us) ---------- ------- --------- ------ ---- ----- ----- --------- ----- ------- vol1__0007 svm1 aggr1 4078 4078 0 0 267255808 0 1092 vol1__0005 svm1 aggr1 4078 4078 0 0 267255808 0 1086 vol1__0003 svm1 aggr1 4077 4077 0 0 267223040 0 1086 vol1__0001 svm1 aggr1 4077 4077 0 0 267239424 0 1087 vol1__0008 svm1 aggr2 2314 2314 0 0 151650304 0 1112 vol1__0006 svm1 aggr2 2144 2144 0 0 140509184 0 1104 vol1__0002 svm1 aggr2 2183 2183 0 0 143065088 0 1106 vol1__0004 svm1 aggr2 2183 2183 0 0 143065088 0 1103

    Le statistiche sul volume vengono visualizzate per costituente (ad esempio, vol1__0015 è il quindicesimo costituente di). FlexGroup vol1 Come si può vedere dall'output di esempio, i componenti di sono più utilizzati rispetto ai componenti peraggr1. aggr2 Per bilanciare il traffico tra gli aggregati, puoi spostare i volumi costituenti tra gli aggregati in modo che il traffico sia distribuito in modo più uniforme.

  3. Se hai aggiunto nuove coppie HA, dovresti spostare i volumi esistenti in nuovi aggregati. Per ulteriori informazioni, consulta Spostamento di volumi tra aggregati.