Utilizzo di Istanze spot - AWS ParallelCluster

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di Istanze spot

AWS ParallelCluster utilizza le istanze Spot se hai impostato SlurmQueues/CapacityTypeo AwsBatchQueues/CapacityTypeto SPOT nel file di configurazione del cluster. Le istanze Spot sono più convenienti rispetto alle istanze on demand, ma potrebbero subire interruzioni. Potrebbe essere utile sfruttare gli avvisi di interruzione dell'istanza Spot, che forniscono un avviso di due minuti prima che Amazon EC2 debba interrompere o terminare l'istanza Spot. Per ulteriori informazioni, consulta le interruzioni delle istanze Spot nella Guida per l'utente di Amazon EC2. Per scoprire come AwsBatchQueuesfunziona con le istanze Spot, consulta Compute Resources nella Guida per l'utente.AWS Batch

Lo scheduler AWS ParallelCluster configurato assegna i lavori alle risorse di calcolo in code con istanze Spot nello stesso modo in cui assegna i lavori alle risorse di calcolo in code con istanze on demand.

Quando utilizzi le istanze Spot, nel tuo account deve esistere un ruolo collegato al servizio. AWSServiceRoleForEC2Spot Per creare questo ruolo nel tuo account utilizzando AWS CLI, esegui il seguente comando:

$ aws iam create-service-linked-role --aws-service-name spot.amazonaws.com

Per ulteriori informazioni, consulta il ruolo collegato ai servizi per le richieste di istanze Spot nella Guida per l'utente di Amazon EC2.

Le sezioni seguenti descrivono tre scenari in cui le istanze Spot possono essere interrotte durante l'utilizzo. SlurmQueues

Scenario 1: viene interrotta un'istanza Spot senza attività in esecuzione

Quando si verifica questa interruzione, AWS ParallelCluster tenta di sostituire l'istanza se la coda dello scheduler ha processi in sospeso che richiedono istanze aggiuntive o se il numero di istanze attive è inferiore a//. SlurmQueuesComputeResourcesMinCount Se non è AWS ParallelCluster possibile effettuare il provisioning di nuove istanze, viene ripetuta periodicamente una richiesta di nuove istanze.

Scenario 2: l'istanza spot che esegue attività a nodo singolo viene interrotta

Il processo ha esito negativo con un codice di stato pari aNODE_FAIL, e il processo viene richiesto (a meno che non --no-requeue sia specificato al momento dell'invio del lavoro). Se il nodo è statico, viene sostituito. Se il nodo è un nodo dinamico, il nodo viene terminato e reimpostato. Per ulteriori informazioni sull'sbatchinclusione del --no-requeue parametro, sbatchconsultate la Slurmdocumentazione.

Scenario 3: l'istanza spot che esegue attività a più nodi viene interrotta

Il processo ha esito negativo con un codice di stato pari aNODE_FAIL, e il processo viene richiesto (a meno che non sia --no-requeue stato specificato al momento dell'invio del lavoro). Se il nodo è statico, viene sostituito. Se il nodo è un nodo dinamico, il nodo viene terminato e reimpostato. Gli altri nodi che eseguivano i processi terminati potrebbero essere assegnati ad altri lavori in sospeso o ridimensionati una volta trascorso il tempo/configurato SlurmSettings. ScaledownIdletime

Per ulteriori informazioni sulle istanze Spot, consulta le istanze Spot nella Guida per l'utente di Amazon EC2.