SUS04-BP05 Entfernen nicht benötigter oder redundanter Daten - AWS Well-Architected Framework

SUS04-BP05 Entfernen nicht benötigter oder redundanter Daten

Entfernen Sie nicht benötigte oder redundante Daten, um die zum Speichern Ihrer Datensätze benötigten Speicherressourcen zu minimieren.

Typische Anti-Muster:

  • Sie duplizieren Daten, die leicht abgerufen oder erneut erstellt werden können.

  • Sie sichern alle Daten, ohne ihre Kritikalität zu berücksichtigen.

  • Sie löschen Daten nur unregelmäßig, nur bei bestimmten Ereignissen oder gar nicht.

  • Sie speichern Daten redundant, unabhängig von der Stabilität des Speicherservices.

  • Sie aktivieren die Amazon-S3-Versionsverwaltung, ohne dass dies geschäftlich gerechtfertigt ist.

Vorteile der Einführung dieser bewährten Methode: Durch das Entfernen nicht benötigter Daten werden die für Ihre Workload benötigte Speichergröße und die Umweltbelastungen durch die Workload reduziert.

Risikostufe, wenn diese bewährte Methode nicht eingeführt wird: Mittel

Implementierungsleitfaden

Speichern Sie keine Daten, die Sie nicht benötigen. Automatisieren Sie das Löschen von nicht benötigten Daten. Verwenden Sie Technologien, die Daten auf Datei- und Blockebene deduplizieren. Nutzen Sie native Servicefeatures für Replikation und Redundanz.

Implementierungsschritte

  • Bewerten Sie, ob Sie das Speichern von Daten vermeiden können, indem Sie vorhandene, öffentlich verfügbare Datensätze in AWS Data Exchange und offene Daten in AWS verwenden.

  • Verwenden Sie Mechanismen, die Daten auf Block- und Objektebene deduplizieren können. Hier finden Sie einige Beispiele zum Deduplizieren von Daten in AWS:

    Storage Service Deduplizierungsmechanismus

    Amazon S3

    Verwenden Sie AWS Lake Formation FindMatches und das neue FindMatches ML Transform, um übereinstimmende Einträge in einem Datensatz zu finden (auch solche ohne Bezeichner).

    Amazon FSx

    Verwenden Sie die Datendeduplizierung in Amazon FSx für Windows.

    Snapshots von Amazon Elastic Block Store

    Snapshots sind inkrementelle Backups, d. h., es werden nur die Blöcke des Geräts gespeichert, die sich seit der letzten Snapshot-Speicherung geändert haben.

  • Analysieren Sie den Datenzugriff, um nicht benötigte Daten zu identifizieren. Automatisieren Sie Lebenszyklusrichtlinien. Nutzen Sie zum Löschen native Service-Features wie die Gültigkeitsdauer von Amazon DynamoDB, Amazon-S3-Lebenszyklen oder die Protokollaufbewahrung von Amazon CloudWatch.

  • Verwenden Sie Virtualisierungsfunktionen in AWS, um Daten an der Quelle beizubehalten und eine Duplikation zu vermeiden.

  • Verwenden Sie Sicherungstechnologien, mit denen inkrementelle Sicherungen möglich sind.

  • Nutzen Sie zum Erfüllen der Stabilitätsziele die Stabilität von Amazon S3 und Replikation von Amazon EBS anstelle von selbst verwalteten Technologien wie redundanten Arrays unabhängiger Datenträger (Redundant Array Of Independent Disks, RAID).

  • Zentralisieren Sie Protokoll- und Nachverfolgungsdaten, deduplizieren Sie identische Protokolleinträge und richten Sie Mechanismen für die Anpassung der Ausführlichkeit ein, wenn notwendig.

  • Füllen Sie Caches nur vorab aus, wenn dies begründet werden kann.

  • Richten Sie Überwachung und Automatisierung für den Cache ein, um seine Größe entsprechend anzupassen.

  • Entfernen Sie veraltete Bereitstellungen und Komponenten aus Objektspeichern und Edge-Zwischenspeichern, wenn Sie neue Versionen Ihrer Workload veröffentlichen.

Ressourcen

Zugehörige Dokumente:

Zugehörige Videos:

Zugehörige Beispiele: