Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo di Istanze spot
AWS ParallelCluster utilizza le istanze Spot se hai impostato SlurmQueues/CapacityTypeo AwsBatchQueues/CapacityTypeto SPOT
nel file di configurazione del cluster. Le istanze Spot sono più convenienti rispetto alle istanze on demand, ma potrebbero subire interruzioni. Potrebbe essere utile sfruttare gli avvisi di interruzione dell'istanza Spot, che forniscono un avviso di due minuti prima che Amazon EC2 debba interrompere o terminare l'istanza Spot. Per ulteriori informazioni, consulta le interruzioni delle istanze Spot nella Guida per l'utente di Amazon EC2. Per scoprire come AwsBatchQueuesfunziona con le istanze Spot, consulta Compute Resources nella Guida per l'utente.AWS Batch
Lo scheduler AWS ParallelCluster configurato assegna i lavori alle risorse di calcolo in code con istanze Spot nello stesso modo in cui assegna i lavori alle risorse di calcolo in code con istanze on demand.
Quando utilizzi le istanze Spot, nel tuo account deve esistere un ruolo collegato al servizio. AWSServiceRoleForEC2Spot Per creare questo ruolo nel tuo account utilizzando AWS CLI, esegui il seguente comando:
$
aws iam create-service-linked-role --aws-service-name spot.amazonaws.com
Per ulteriori informazioni, consulta il ruolo collegato ai servizi per le richieste di istanze Spot nella Guida per l'utente di Amazon EC2.
Le sezioni seguenti descrivono tre scenari in cui le istanze Spot possono essere interrotte durante l'utilizzo. SlurmQueues
Scenario 1: viene interrotta un'istanza Spot senza attività in esecuzione
Quando si verifica questa interruzione, AWS ParallelCluster tenta di sostituire l'istanza se la coda dello scheduler ha processi in sospeso che richiedono istanze aggiuntive o se il numero di istanze attive è inferiore a//. SlurmQueuesComputeResourcesMinCount Se non è AWS ParallelCluster possibile effettuare il provisioning di nuove istanze, viene ripetuta periodicamente una richiesta di nuove istanze.
Scenario 2: l'istanza spot che esegue attività a nodo singolo viene interrotta
Il processo ha esito negativo con un codice di stato pari aNODE_FAIL
, e il processo viene richiesto (a meno che non --no-requeue
sia specificato al momento dell'invio del lavoro). Se il nodo è statico, viene sostituito. Se il nodo è un nodo dinamico, il nodo viene terminato e reimpostato. Per ulteriori informazioni sull'sbatch
inclusione del --no-requeue
parametro, sbatch
Scenario 3: l'istanza spot che esegue attività a più nodi viene interrotta
Il processo ha esito negativo con un codice di stato pari aNODE_FAIL
, e il processo viene richiesto (a meno che non sia --no-requeue
stato specificato al momento dell'invio del lavoro). Se il nodo è statico, viene sostituito. Se il nodo è un nodo dinamico, il nodo viene terminato e reimpostato. Gli altri nodi che eseguivano i processi terminati potrebbero essere assegnati ad altri lavori in sospeso o ridimensionati una volta trascorso il tempo/configurato SlurmSettings. ScaledownIdletime
Per ulteriori informazioni sulle istanze Spot, consulta le istanze Spot nella Guida per l'utente di Amazon EC2.