複数のキューの設定 - AWS ParallelCluster

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

複数のキューの設定

複数のキューの設定

AWS ParallelCluster バージョン 3 では、 Schedulerを に設定slurmし、設定SlurmQueuesファイルに複数のキューを指定することで、複数のキューを設定できます。このモードでは、設定ファイルの ComputeResources セクションで指定されているコンピューティングノードに異なるインスタンスタイプが共存します。異なるインスタンスタイプの ComputeResources は、SlurmQueues の必要に応じてスケールアップまたはスケールダウンされます。

クラスターキューとコンピューティングリソースのクォータ
リソース クォータ

Slurm queues

クラスターあたり 50 キュー

Compute resources

1 キューあたり 50 のコンピューティングリソース

1 クラスターあたり 50 のコンピューティングリソース

ノード数

キュー内の ComputeResources の各コンピューティングリソースには、固有の NameInstanceTypeMinCount、および MaxCount が必要です。MinCount および MaxCount は、キュー内の ComputeResources でコンピューティングリソースのインスタンス範囲を定義するデフォルト値があります。MinCount および MaxCount には独自の値を指定することもできます。ComputeResources 内の各コンピューティングリソースは、1 からMinCount の値までの番号が付けられた静的ノードと、MinCount の値から MaxCount の値までの番号が付けられた動的ノードで構成されます。

サンプルの構成

クラスター設定ファイルの Scheduling セクションの例を次に示します。この設定では、queue1 および queue2 という 2 つのキューがあり、それぞれのキューには MaxCount を指定した ComputeResources があります。

Scheduling: Scheduler: slurm SlurmQueues: - Name: queue1 ComputeResources: - InstanceType: c5.xlarge MaxCount: 5 Name: c5xlarge - InstanceType: c4.xlarge MaxCount: 5 Name: c4xlarge - Name: queue2 ComputeResources: - InstanceType: c5.xlarge MaxCount: 5 Name: c5xlarge

HostNames

コンピューティングフリートに起動されるインスタンスは、動的に割り当てられます。各ノードにはホスト名が生成されます。デフォルトでは、ホスト名 の次の形式 AWS ParallelCluster が使用されます。

$HOSTNAME=$QUEUE-$STATDYN-$COMPUTE_RESOURCE-$NODENUM

  • $QUEUE はキューの名前です。例えば、SlurmQueues セクションに Name を「queue-name」に設定したエントリーがある場合、「$QUEUE」は「queue-name」になります。

  • $STATDYN は、静的ノードの場合は st、動的ノードの場合は dy です。

  • $COMPUTE_RESOURCE は、このノードに対応する ComputeResources コンピューティングリソースの Name です。

  • $NODENUM はノードの番号です。$NODENUM は、静的ノードの場合は 1 から MinCount までの値、動的ノードの場合は 1 から MaxCount - MinCount までの値です。

上記の設定ファイルの例では、queue1 のノードと c5xlarge のコンピューティングリソースは、ホスト名が queue1-dy-c5xlarge-1 となります。

ホスト名と完全修飾ドメイン名 (FQDN) の両方は、Amazon Route 53 のホストゾーンを使用して作成されます。FQDN は $HOSTNAME.$CLUSTERNAME.pcluster で、$CLUSTERNAME はクラスターの名前です。

Slurm ノード名にも同じ形式が使用されます。

ユーザーは、 で使用されるデフォルトのホスト名形式ではなく、コンピューティングノードで動作するインスタンスのデフォルトの Amazon EC2 ホスト名を使用することを選択できます AWS ParallelCluster。これは、 UseEc2Hostnamesパラメータを true に設定することで実行できます。ただし、Slurmノード名は引き続きデフォルトの AWS ParallelCluster 形式を使用します。