Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creazione di un cluster in AWS Parallel Computing Service
Questo argomento fornisce una panoramica delle opzioni disponibili e descrive gli elementi da considerare quando si crea un cluster in AWS Parallel Computing Service (AWS PCS). Se è la prima volta che crei un cluster AWS PCS, ti consigliamo di seguirloInizia a usare AWS Parallel Computing Service. Il tutorial può aiutarti a creare un sistema HPC funzionante senza approfondire tutte le opzioni e le architetture di sistema disponibili possibili.
Prerequisiti
-
Un VPC e una sottorete esistenti che soddisfano i requisiti. AWS Rete PCS Prima di implementare un cluster da utilizzare in produzione, ti consigliamo di approfondire le nozioni relative ai requisiti del VPC e delle sottoreti. Per creare un VPC e una sottorete, vedere. Creazione di un VPC per il AWS cluster PCS
-
Un preside IAM con autorizzazioni per creare e gestire AWS risorse PCS. Per ulteriori informazioni, consulta Servizio di Identity and Access Management per AWS Parallel Computing.
Crea un cluster AWS PCS
È possibile utilizzare AWS Management Console o AWS CLI per creare un cluster.
- AWS Management Console
-
Come creare un cluster
-
Apri la console AWS PCS a https://console.aws.amazon.com/pcs/home#/clusters
e scegli Crea cluster. -
Nella sezione Configurazione del cluster, inserisci i seguenti campi:
-
Nome del cluster: un nome per il cluster. Il nome può contenere solo caratteri alfanumerici (con distinzione tra lettere maiuscole e minuscole) e trattini. Deve iniziare con un carattere alfabetico e non può superare i 40 caratteri. Il nome deve essere univoco all'interno del Regione AWS e in Account AWS cui si sta creando il cluster.
-
Scheduler: scegli uno scheduler e una versione. Per ulteriori informazioni, consulta Versioni Slurm in PCS AWS.
-
Dimensioni del controller: scegli una dimensione per il controller. Ciò determina il numero di lavori e nodi di elaborazione simultanei che possono essere gestiti dal cluster AWS PCS. È possibile impostare la dimensione del controller solo al momento della creazione del cluster. Per ulteriori informazioni sul dimensionamento, vedereDimensione del cluster in AWS PCS.
-
-
Nella sezione Rete, selezionate i valori per i seguenti campi:
-
Tipo di rete: scegli il tipo di indirizzo IP per il tuo cluster. Il cluster può utilizzare uno IPv4 o entrambi IPv6, ma non entrambi. Il VPC e le sottoreti devono utilizzare lo stesso tipo di indirizzo di rete. Il blocco di indirizzi IP utilizzato per ogni sottorete deve avere almeno un indirizzo disponibile. AWS riserva alcuni indirizzi in ogni sottorete. Per ulteriori informazioni, consulta Blocchi CIDR della sottorete nella Guida per l'utente di Amazon VPC.
-
VPC: scegli un VPC esistente che soddisfi i requisiti PCS. AWS Per ulteriori informazioni, consulta AWS Requisiti e considerazioni su PCS, VPC e sottorete. Dopo aver creato il cluster, non puoi modificarne il VPC. Se non VPCs ne è elencato nessuno, devi prima crearne uno.
-
Subnet: vengono elencate tutte le sottoreti disponibili nel VPC selezionato. Scegli una sottorete che soddisfi i requisiti della sottorete PCS. AWS Per ulteriori informazioni, consulta AWS Requisiti e considerazioni su PCS, VPC e sottorete. Ti consigliamo di selezionare una sottorete privata per evitare di esporre gli endpoint dello scheduler alla rete Internet pubblica.
-
Gruppi di sicurezza: specificate i gruppi di sicurezza che desiderate che AWS PCS associ alle interfacce di rete create per il cluster. È necessario selezionare almeno un gruppo di sicurezza che consenta la comunicazione tra il cluster e i relativi nodi di elaborazione. È possibile selezionare Creazione rapida di un gruppo di sicurezza per fare in modo che AWS PCS ne crei uno con la configurazione necessaria nel VPC selezionato oppure selezionare un gruppo di sicurezza esistente. Per ulteriori informazioni, consulta Requisiti e considerazioni sui gruppi di sicurezza.
-
-
(Facoltativo) Nella sezione di configurazione della contabilità Slurm, è possibile abilitare la contabilità Slurm e impostare i parametri di contabilità. Per ulteriori informazioni, consulta Contabilità dei liquami in PCS AWS.
-
(Facoltativo) Nella sezione di configurazione di Slurm, è possibile specificare le opzioni di configurazione Slurm che sostituiscono i valori predefiniti impostati da PCS: AWS
-
Ridimensiona i tempi di inattività: controlla per quanto tempo i nodi di elaborazione con provisioning dinamico rimangono attivi dopo il completamento o la fine dei lavori su di essi assegnati. L'impostazione di questo valore su un valore più lungo può aumentare la probabilità che un processo successivo possa essere eseguito sul nodo, ma può comportare un aumento dei costi. Un valore più breve ridurrà i costi, ma potrebbe aumentare la percentuale di tempo che il sistema HPC impiega per il provisioning dei nodi anziché per l'esecuzione dei job su di essi.
-
Prolog: si tratta di un percorso completo per accedere a una directory di script Prolog sulle istanze del gruppo di nodi di calcolo. Corrisponde all'impostazione Prolog in Slurm.
Nota che questa deve essere una directory, non un percorso verso un eseguibile specifico. -
Epilog: si tratta di un percorso completo verso una directory di script di epilog sulle istanze del gruppo di nodi di calcolo. Corrisponde all'impostazione Epilog in Slurm.
Nota che questa deve essere una directory, non il percorso di un eseguibile specifico. -
Seleziona i parametri del tipo: questo aiuta a controllare l'algoritmo di selezione delle risorse utilizzato da Slurm. L'impostazione di questo valore su
CR_CPU_Memory
attiverà la pianificazione in base alla memoria, mentre impostandolo su attiverà la pianificazione solo perCR_CPU
la CPU. Questo parametro corrisponde all'impostazione di Slurm dove è SelectTypeParametersimpostata da PCS. SelectType
select/cons_tres
AWS
-
-
(Facoltativo) In Tag, aggiungi qualsiasi tag al tuo cluster AWS PCS.
-
Scegli Create cluster (Crea cluster). Il campo Status mostra
Creating
mentre il AWS PCS crea il cluster. Questo processo può richiedere alcuni minuti.
Importante
Può esserci solo 1 cluster in uno
Creating
stato Regione AWS per ogni stato Account AWS. AWS PCS restituisce un errore se c'è già un cluster in unoCreating
stato quando si tenta di creare un cluster. -
- AWS CLI
-
Come creare un cluster
-
Crea un cluster con il comando seguente. Prima di eseguire il comando, apporta le modifiche seguenti:
-
Sostituiscilo
region
con l'ID in Regione AWS cui desideri creare il cluster, ad esempious-east-1
. -
Sostituisci
my-cluster
con un nome da assegnare al cluster. Il nome può contenere solo caratteri alfanumerici (con distinzione tra lettere maiuscole e minuscole) e trattini. Deve iniziare con un carattere alfabetico e non può superare i 40 caratteri. Il nome deve essere univoco all'interno Regione AWS e nel Account AWS luogo in cui si sta creando il cluster. -
24.11
Sostituiscilo con qualsiasi versione supportata di Slurm.Nota
AWS PCS attualmente supporta Slurm 24.11 e 24.05.
-
Sostituiscilo
SMALL
con qualsiasi dimensione di cluster supportata. Ciò determina quanti processi e nodi di calcolo simultanei possono essere gestiti dal cluster AWS PCS. Può essere impostato solo al momento della creazione del cluster. Per ulteriori informazioni sul dimensionamento, vedereDimensione del cluster in AWS PCS. -
Sostituisci il valore di
subnetIds
con il tuo. Ti consigliamo di selezionare una sottorete privata per evitare di esporre gli endpoint dello scheduler alla rete Internet pubblica. -
Specificate
securityGroupIds
quello che desiderate che AWS PCS associ alle interfacce di rete che crea per il cluster. I gruppi di sicurezza devono trovarsi nello stesso VPC del cluster. È necessario selezionare almeno un gruppo di sicurezza che consenta la comunicazione tra il cluster e i relativi nodi di calcolo. Per ulteriori informazioni, consulta Requisiti e considerazioni sui gruppi di sicurezza. -
Facoltativamente, puoi fornire una chiave KMS personalizzata per crittografare i dati del controller utilizzando.
--kms-key-id
Sostituiscikms-key
con un ARN, un ID chiave o un alias KMS esistente. Tieni presente che l'account utilizzato per creare il cluster deve disporre deikms-key
kms:Decrypt
privilegi sulla chiave KMS personalizzata.
aws pcs create-cluster --region
region
\ --cluster-namemy-cluster
\ --scheduler type=SLURM,version=24.11
\ --sizeSMALL
\ --networking subnetIds=subnet-ExampleId1
,securityGroupIds=sg-ExampleId1
-
per utilizzarlo IPv6, aggiungilo
networkType=IPV6
alla--networking
configurazione.--networking networkType=IPV6,subnetIds=
subnet-ExampleId1
,securityGroupIds=sg-ExampleId1
-
Facoltativamente, è possibile aggiungere l'
--slurm-configration
opzione per personalizzare il comportamento di Slurm e specificare le opzioni di configurazione di Slurm. L'esempio seguente imposta il tempo di inattività della scala ridotta a 60 minuti (3600 secondi), abilita la contabilità Slurm e specifica le impostazioni come valore per.slurm.conf
slurmCustomSettings
Per ulteriori informazioni, consulta Contabilità dei liquami in PCS AWS.Nota
La contabilità è supportata per Slurm 24.11 o versioni successive.
aws pcs create-cluster --region
region
\ --cluster-namemy-cluster
\ --scheduler type=SLURM,version=24.11
\ --sizeSMALL
\ --networking subnetIds=subnet-ExampleId1
,securityGroupIds=sg-ExampleId1
--slurm-configuration scaleDownIdleTimeInSeconds=3600,accounting='{mode=STANDARD}',slurmCustomSettings='[{parameterName=SelectTypeParameters,parameterValue=CR_CPU_Memory}]'
-
-
Il provisioning del cluster può richiedere diversi minuti. È possibile eseguire query sullo stato del cluster con il comando seguente. Non procedere alla creazione di code o gruppi di nodi di calcolo finché non viene visualizzato il campo di stato del cluster.
ACTIVE
aws pcs get-cluster --region
region
--cluster-identifiermy-cluster
Importante
Può esserci solo 1 cluster in uno
Creating
stato per ogni stato. Regione AWS Account AWS AWS PCS restituisce un errore se c'è già un cluster in unoCreating
stato quando si tenta di creare un cluster. -
Passaggi successivi consigliati per il cluster
-
Aggiungi gruppi di nodi di calcolo.
-
Aggiungi code.
-
Attivare la registrazione nel log.