PERF03-BP01 Verwenden Sie einen speziell entwickelten Datenspeicher, der Ihre Datenzugriffs- und Speicheranforderungen am besten unterstützt

Machen Sie sich mit Datenmerkmalen (wie Freigabe, Größe, Cache-Größe, Zugriffsmuster, Latenz, Durchsatz und Persistenz von Daten) vertraut, um die richtigen, speziell entwickelten Datenspeicher (Speicher oder Datenbank) für die Workload auszuwählen.

Typische Anti-Muster:

Sie halten an einem Datenspeicher fest, da es interne Erfahrungen und Wissen über eine bestimmte Datenbanklösung gibt.
Sie gehen davon aus, dass für alle Workloads ähnliche Datenspeicher- und Zugriffsanforderungen gelten.
Sie haben keinen Datenkatalog zur Inventarisierung Ihrer Datenbestände eingeführt.

Vorteile der Nutzung dieser bewährten Methode: Wenn Sie die Datenmerkmale und -anforderungen verstehen, können Sie die effizienteste und leistungsfähigste Speichertechnologie ermitteln, die für Ihre Workload-Anforderungen geeignet ist.

Risikostufe bei fehlender Befolgung dieser bewährten Methode: Hoch

Implementierungsleitfaden

Achten Sie bei der Auswahl und Implementierung des Datenspeichers darauf, dass die Abfrage-, Skalierungs- und Speichereigenschaften die Anforderungen an die Workload-Daten erfüllen. AWS bietet zahlreiche Datenspeicher- und Datenbanktechnologien, darunter Blockspeicher-, Objektspeicher-, Streaming-Speicher-, Dateisystem-, relationale, Schlüsselwert-, Dokument-, In-Memory-, Diagramm-, Zeitreihen- und Hauptbuchdatenbanken. Jede Datenverwaltungslösung hat verfügbare Optionen und Konfigurationen, um Ihre Anwendungsfälle und Datenmodelle zu unterstützen. Wenn Sie die Eigenschaften und Anforderungen von Daten verstehen, können Sie sich von monolithischen Speichertechnologien und restriktiven one-size-fits-all Ansätzen lösen und sich auf das angemessene Datenmanagement konzentrieren.

Implementierungsschritte

Führen Sie eine Bestandsaufnahme der verschiedenen Datentypen durch, die in Ihrer Workload vorhanden sind.
Verstehen und dokumentieren Sie Datenmerkmale und -anforderungen, einschließlich:
- Datentyp (strukturiert, semistrukturiert, relational)
- Datenvolumen und -wachstum
- Lebensdauer von Daten: anhaltend, flüchtig, vorübergehend
- ACIDAnforderungen (Atomarität, Konsistenz, Isolierung, Haltbarkeit)
- Datenzugriffsmuster (leseintensiv oder schreibintensiv)
- Latency
- Durchsatz
- IOPS(Eingabe-/Ausgabevorgänge pro Sekunde)
- Aufbewahrungszeitraum

Erfahren Sie mehr über die verschiedenen Datenspeicher (Speicher - und Datenbankdienste), die für Ihren Workload verfügbar AWS sind und Ihre Dateneigenschaften erfüllen können, wie unter beschrieben. PERF01-BP01 Erfahren Sie mehr über verfügbare Cloud-Dienste und -Funktionen und verstehen Sie sie Einige Beispiele für AWS -Speichertechnologien und ihre Schlüsselmerkmale sind:

Typ	AWS Services	Schlüsselmerkmale
Objektspeicher	Amazon S3	Unbegrenzte Skalierbarkeit, hohe Verfügbarkeit und mehrere Optionen für Barrierefreiheit. Für die Übertragung von Objekten in und aus Amazon S3 und den Zugriff auf diese Objekte können Sie einen Service wie z. B. Transfer Acceleration oder Zugangspunkte verwenden, um Ihren Standort, Ihre Sicherheitsanforderungen und Zugriffsmuster zu unterstützen.
Archivieren von Speichern	Amazon S3 Glacier	Für die Datenarchivierung entwickelt.
Streaming-Speicher	Amazon Kinesis Von Amazon Managed Streaming for Apache Kafka (AmazonMSK)	Effiziente Erfassung und Speicherung von Streaming-Daten.
Gemeinsames Dateisystem	Amazon Elastic File System (AmazonEFS)	Bereitstellbares Dateisystem, auf das mehrere Arten von Datenverarbeitungslösungen zugreifen können.
Gemeinsames Dateisystem	Amazon FSx	Basiert auf den neuesten AWS Computerlösungen zur Unterstützung von vier häufig verwendeten Dateisystemen: Open NetApp ONTAPZFS, Windows File Server und Lustre. Die FSx Latenz, der Durchsatz und der Durchsatz von Amazon IOPS variieren je nach Dateisystem und sollten bei der Auswahl des richtigen Dateisystems für Ihre Workload-Anforderungen berücksichtigt werden.
Blockspeicher	Amazon Elastic Block Store (AmazonEBS)	Skalierbarer, leistungsstarker Blockspeicher-Service, der für Amazon Elastic Compute Cloud (AmazonEC2) entwickelt wurde. Amazon EBS bietet SSD -gestützten Speicher für IOPS transaktionsintensive Workloads und HDD -gestützten Speicher für durchsatzintensive Workloads.
Relationale Datenbank	Amazon Aurora, Amazon RDS, Amazon Redshift.	Entwickelt, um Transaktionen ACID (Atomizität, Konsistenz, Isolierung, Haltbarkeit) zu unterstützen und die referenzielle Integrität und hohe Datenkonsistenz aufrechtzuerhalten. Viele traditionelle Anwendungen wie Enterprise Resource Planning (ERP), Customer Relationship Management (CRM) und E-Commerce verwenden relationale Datenbanken zum Speichern ihrer Daten.
Schlüssel-Werte-Datenbank	Amazon-DynamoDB	Für gängige Zugriffsmuster optimiert, üblicherweise zum Speichern und Abrufen großer Datenmengen. Web-Apps mit hohem Datenverkehr, E-Commerce-Systeme und Gaming-Anwendungen sind typische Anwendungsfälle für Schlüssel-Werte-Datenbanken.
Dokumentdatenbank	Amazon DocumentDB	Entwickelt, um halbstrukturierte Daten als JSON ähnliche Dokumente zu speichern. Mit diesen Datenbanken können Entwickler Anwendungen wie Content Management, Kataloge und Benutzerprofile schnell erstellen und aktualisieren.
In-Memory-Datenbanken	Amazon ElastiCache, Amazon MemoryDB für Redis	Dies wird für Anwendungen eingesetzt, die einen Echtzeitzugriff auf Daten, die niedrigste Latenz und den höchsten Durchsatz erfordern. Sie können In-Memory-Datenbanken für Anwendungs-Caching, Sitzungsmanagement, Gaming-Bestenlisten, ML-Feature-Store mit niedriger Latenz, Microservices-Messaging-System und einen Streaming-Mechanismus mit hohem Durchsatz verwenden
Graphdatenbank	Amazon Neptune	Dies ist für Anwendungen gedacht, die in Millionen von Beziehungen zwischen hochgradig vernetzten Diagrammdatensätzen mit Millisekunden-Latenz navigieren und diese abfragen müssen. Viele Unternehmen verwenden Graphdatenbanken für Betrugserkennung, soziale Netzwerke und Empfehlungs-Engines.
Zeitreihendatenbank	Amazon Timestream	Diese erfasst, generiert und gewinnt auf effiziente Weise Einblicke aus Daten, die sich im Laufe der Zeit ändern. IoT-Anwendungen und industrielle Telemetrie können Zeitreihendatenbanken nutzen. DevOps
Wide-Column-Datenbanken	Amazon Keyspaces (für Apache Cassandra)	Es werden Tabellen, Zeilen und Spalten verwendet, aber im Gegensatz zu einer relationalen Datenbank können sich die Namen und das Format der Spalten von Zeile zu Zeile in derselben Tabelle unterscheiden. In der Regel werden Wide Column-Speicher in umfangreichen Branchen-Apps für Gerätewartung, Flottenverwaltung und Routenoptimierung eingesetzt.
Ledger	Amazon Quantum Ledger-Datenbank (AmazonQLDB)	Dies bietet eine zentrale und vertrauenswürdige Instanz für die Verwaltung einer skalierbaren, unveränderlichen und kryptografisch überprüfbaren Aufzeichnung von Transaktionen für jede Anwendung. Ledger-Datenbanken werden für Datensatzsysteme, Lieferketten, Registrierungen und sogar Banktransaktionen verwendet.

Wenn Sie eine Datenplattform aufbauen, nutzen Sie die moderne Datenarchitektur, AWS um Ihren Data Lake, Ihr Data Warehouse und speziell entwickelte Datenspeicher zu integrieren.

Die wichtigsten Fragen, die Sie bei der Auswahl eines Datenspeichers für Ihre Workload berücksichtigen müssen, lauten wie folgt:

Frage	Worauf Sie achten sollten
Wie sind die Daten strukturiert?	Wenn die Daten unstrukturiert sind, ziehen Sie einen Objektspeicher wie Amazon S3 oder eine SQL No-Datenbank wie Amazon DocumentDB in Betracht Ziehen Sie für Schlüsselwertdaten DynamoDB, Amazon ElastiCache (OSSRedis) oder Amazon MemoryDB in Betracht
Welches Maß an referentieller Integrität ist erforderlich?	Bei Fremdschlüsseleinschränkungen können relationale Datenbanken wie Amazon RDS und Aurora dieses Maß an Integrität bieten. In der Regel würden Sie bei einem SQL Modell ohne Daten die Normalisierung Ihrer Daten in ein einzelnes Dokument oder eine Sammlung von Dokumenten umwandeln, die dann in einer einzigen Anfrage abgerufen werden könnten, anstatt sie über mehrere Dokumente oder Tabellen hinweg zusammenzufügen.
Ist die Einhaltung von Vorschriften ACID (Atomität, Konsistenz, Isolierung, Haltbarkeit) erforderlich?	Wenn die mit relationalen Datenbanken verknüpften ACID Eigenschaften erforderlich sind, sollten Sie eine relationale Datenbank wie Amazon RDS und Aurora in Betracht ziehen. Wenn für Keine SQL Datenbank eine hohe Konsistenz erforderlich ist, können Sie Strongly Consistent Reads mit DynamoDB verwenden.
Wie ändern sich die Speicheranforderungen im Laufe der Zeit? Wie beeinflusst dies die Skalierbarkeit?	Serverlose Datenbanken wie DynamoDB und Amazon Quantum Ledger Database (AmazonQLDB) werden dynamisch skaliert. Relationale Datenbanken haben oftmals Obergrenzen bei bereitgestelltem Speicher und müssen mithilfe von Mechanismen wie Sharding horizontal partitioniert werden, sobald sie diese Grenzen erreicht haben.
Wie hoch ist der Anteil der Leseabfragen im Verhältnis zu den Schreibabfragen? Könnte Caching die Leistung verbessern?	Leseintensive Workloads können von einer Caching-Ebene profitieren, z. B. DAXwenn es sich bei der Datenbank um ElastiCacheDynamoDB handelt. Lesevorgänge können auch ausgelagert werden, um Repliken mit relationalen Datenbanken wie Amazon zu lesen. RDS
Haben Speicherung und Änderung (OLTP— Online-Transaktionsverarbeitung) oder Abruf und Berichterstattung (OLAP— Analytische Online-Verarbeitung) eine höhere Priorität?	Für die unveränderte Transaktionsverarbeitung mit hohem Durchsatz sollten Sie eine SQL Nein-Datenbank wie DynamoDB in Betracht ziehen. Verwenden Sie Amazon RDS für hohen Durchsatz und komplexe Lesemuster (wie Join) mit Konsistenz. Ziehen Sie für analytische Abfragen eine spaltenförmige Datenbank wie Amazon Redshift in Betracht oder exportieren Sie die Daten nach Amazon S3 und führen Sie Analysen mit Athena oder Amazon durch. QuickSight
Welches Ausmaß an Stabilität erfordern die Daten?	Aurora repliziert Ihre Daten automatisch in drei Availability Zones innerhalb einer Region, was bedeutet, dass Ihre Daten hochbeständig sind und eine geringere Wahrscheinlichkeit von Datenverlust besteht. DynamoDB wird automatisch in mehreren Availability Zones repliziert und bietet hohe Verfügbarkeit und Datenstabilität. Amazon S3 bietet eine Langlebigkeit mit 11 Neunen. Viele Datenbankdienste, wie Amazon RDS und DynamoDB, unterstützen den Export von Daten nach Amazon S3 zur langfristigen Aufbewahrung und Archivierung.
Besteht der Wunsch, sich von kommerziellen Datenbank-Engines oder Lizenzkosten zu entfernen?	Denken Sie an Open-Source-Engines wie Postgre SQL und My SQL on Amazon RDS oder Aurora. Nutzen Sie AWS Database Migration Service und AWS Schema Conversion Tool zum Migrieren von kommerziellen Datenbank-Engines zu Open Source-Lösungen.
Was ist die Betriebserwartung an die Datenbank? Ist der Umstieg zu verwalteten Services eine Priorität?	Die Nutzung von Amazon RDS anstelle von Amazon und DynamoDB oder Amazon DocumentDBEC2, anstatt eine SQL No-Datenbank selbst zu hosten, kann den Betriebsaufwand reduzieren.
Wie erfolgt derzeit der Zugriff auf die Datenbank? Geht es nur um Anwendungszugriff oder gibt es Business Intelligence (BI) -Benutzer und andere verbundene Anwendungen? off-the-shelf	Wenn Sie von externen Tools abhängig sind, müssen Sie möglicherweise mit der Datenbank, die unterstützt wird, die Kompatibilität aufrecht erhalten. Amazon RDS ist vollständig kompatibel mit den verschiedenen Engine-Versionen, die es unterstützt, einschließlich Microsoft SQL Server, OracleSQL, My und PostgreSQL.

Führen Sie Experimente und Benchmarking in einer Nicht-Produktionsumgebung durch, um herauszufinden, welcher Datenspeicher Ihre Workload-Anforderungen erfüllen kann.

Ressourcen

Zugehörige Dokumente:

Zugehörige Videos:

Zugehörige Beispiele:

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

LEIST 3. Wie speichern und verwalten Sie die Daten in Ihrer Workload und wie greifen Sie darauf zu?

PERF03-BP02 Evaluieren Sie die verfügbaren Konfigurationsoptionen für den Datenspeicher