Implementierungsleitfaden Implementierungsschritte Ressourcen

SUS05-BP04 Optimieren der Nutzung von hardwarebasierten Computing-Beschleunigern

Sie können die Nutzung von beschleunigten Computing-Instances optimieren, um die Anforderungen Ihres Workloads an die physische Infrastruktur zu reduzieren.

Typische Anti-Muster:

Sie überwachen die GPU-Nutzung nicht.
Sie verwenden eine allgemeine Instance für den Workload, während eine speziell angefertigte Instance eine höhere Leistung, geringere Kosten und eine bessere Leistung pro Watt bieten kann.
Sie verwenden hardwarebasierte Computing-beschleuniger für Aufgaben, bei denen CPU-basierte Alternativen effizienter sind.

Vorteile der Einführung dieser bewährten Methode: Indem Sie die Nutzung von hardwarebasierten Accelerators optimieren, können Sie die Anforderungen Ihres Workloads an die physische Infrastruktur reduzieren.

Risikostufe, wenn diese bewährte Methode nicht eingeführt wird: mittel

Implementierungsleitfaden

Wenn Sie eine hohe Verarbeitungsleistung benötigen, können Sie beschleunigte Computing-Instances verwenden. Diese bieten Zugriff auf hardwarebasierte Computing-Beschleuniger wie Grafikprozessoren (Graphics Processing Units, GPUs) und Field Programmable Gate Arrays (FPGAs). Diese Hardwarebeschleuniger führen bestimmte Funktionen wie die Grafikverarbeitung oder Datenmusterzuordnung effizienter aus als CPU-basierte Alternativen. Viele beschleunigte Workloads, wie Rendering, Transcodierung und Machine Learning, sind sehr variabel im Bezug auf die Ressourcennutzung. Betreiben Sie diese Hardware nur so lange wie nötig und nehmen Sie sie automatisch außer Betrieb, wenn sie nicht mehr benötigt wird, um den Ressourcenverbrauch zu minimieren.

Implementierungsschritte

Ermitteln Sie, welche beschleunigten Computing-Instances für Ihre Anforderungen geeignet sind.
Nutzen Sie für Machine Learning-Workloads spezielle Hardware, die auf Ihren Workload abgestimmt ist, z. B. AWS Trainium, AWS Inferentia oder Amazon EC2 DL1. AWS-Inferentia-Instances wie Inf2-Instances bieten eine um bis zu 50 % bessere Leistung pro Watt als vergleichbare Amazon EC2-Instances.
Erfassen Sie Nutzungsmetriken für Ihre beschleunigten Computing-Instances. Sie können z. B. CloudWatch-Agents verwenden, um Metriken wie utilization_gpu und utilization_memory für Ihre GPUs zu erfassen. Dies wird im Artikel zum Erfassen von NVIDIA GPU-Metriken mit Amazon CloudWatch genauer beschrieben.
Optimieren Sie Code, Netzwerkbetrieb und die Einstellungen von Hardwarebeschleunigern, um sicherzustellen, dass die zugrunde liegende Hardware optimal genutzt wird.
Verwenden Sie die aktuellen leistungsstarken Bibliotheken und GPU-Treiber.
Automatisieren Sie die Freigabe nicht genutzter GPU-Instances.

Ressourcen

Zugehörige Dokumente:

Accelerated Computing
Let's Architect! Architecting with custom chips and accelerators (Erstellen von Architekturen mit benutzerdefinierten Chips und Beschleunigern)
How do I choose the appropriate Amazon EC2 instance type for my workload? (Wie wähle ich einen geeigneten EC2-Instance-Typ für meinen Workload aus?)
Amazon EC2-VT1-Instances
Auswählen des besten KI-Accelerators und der Modellkompilierung für Computer Vision Inference mit Amazon SageMaker AI

Zugehörige Videos:

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

SUS05-BP03 Verwenden verwalteter Services

Prozess und Kultur