GPU アクセラレーターを使用する - AWS Deadline クラウド

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

GPU アクセラレーターを使用する

1 つ以上の GPUs を使用してジョブの処理を高速化するように、サービスマネージドフリートでワーカーホストを設定できます。アクセラレーターを使用すると、ジョブの処理にかかる時間を短縮できますが、各ワーカーインスタンスのコストが増加する可能性があります。GPU アクセラレーターを使用するフリートとそうでないフリートのトレードオフを理解するには、ワークロードをテストする必要があります。

GPUsは、wait-and-saveのインスタンスを持つフリートでは使用できません。

注記

テスト目的では、1 つの GPU に制限されます。本番稼働用ワークロードの詳細をリクエストするには、「Service Quotas ユーザーガイド」の「クォータの引き上げのリクエスト」を参照してください。 Service Quotas

ワーカーインスタンス機能を指定するときに、フリートが GPU アクセラレーターを使用するかどうかを決定します。GPUs を使用する場合は、各インスタンスの GPUs の最小数と最大数、使用する GPU チップのタイプ、GPUs のランタイムドライバーを指定できます。

使用可能な GPU アクセラレーターは次のとおりです。

  • T4 - NVIDIA T4 Tensor コア GPU

  • A10G - NVIDIA A10G Tensor Core GPU

  • L4 - NVIDIA L4 Tensor コア GPU

  • L40s - NVIDIA L40S Tensor Core GPU

次のランタイムドライバーから選択できます。

  • Latest - チップで使用できる最新のランタイムを使用します。を指定latestし、ランタイムの新しいバージョンがリリースされると、ランタイムの新しいバージョンが使用されます。

  • grid:r570 - NVIDIA vGPU ソフトウェア 18

  • grid:r535 - NVIDIA vGPU ソフトウェア 16

ランタイムを指定しない場合、Deadline Cloud はデフォルトlatestとして を使用します。ただし、複数のアクセラレーターがあり、一部のアクセラレーターlatestに を指定し、他のアクセラレーターを空白のままにすると、Deadline Cloud は例外を発生させます。