Technische Bewertung - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Technische Bewertung

Eine technische Bewertung ist wichtig, da sie Ihnen einen Überblick über die aktuellen technischen Fähigkeiten Ihres Unternehmens gibt. Die Bewertung umfasst Datenverwaltung, Datenaufnahme, Datentransformation, Datenaustausch, Plattform für maschinelles Lernen (ML), Prozesse und Automatisierung. 

Hier finden Sie Beispiele für Fragen, die Sie während der technischen Bewertung nach Teams stellen können. Sie können je nach Kontext Fragen hinzufügen.

Team für Datentechnik

  • Was sind die aktuellen Herausforderungen im Zusammenhang mit der Datenerfassung für Ihr Team? 

  • Gibt es externe oder interne Datenquellen, die Ihr Team benötigt und die nicht zur Erfassung verfügbar sind? Warum sind sie nicht verfügbar?

  • Aus welchen Arten von Datenquellen nehmen Sie Daten auf (z. B. MySQL-Datenbanken, Salesforce-API, empfangene Dateien, Website-Navigationsdaten)?

  • Wie lange dauert es, Daten aus einer neuen Datenquelle aufzunehmen?

  • Sind die Prozesse der Datenaufnahme aus einer neuen Quelle automatisiert?

  • Wie einfach ist es für ein Entwicklungsteam, Transaktionsdaten für Analysen aus seiner Anwendung zu veröffentlichen?

  • Haben Sie Tools für vollständige oder inkrementelle Ladungen (in Batches oder Mikrobatches) aus Ihrer Datenquelle?

  • Haben Sie Tools zur Erfassung von Änderungsdaten (CDC) für kontinuierliche Ladungen aus Ihren Datenbanken?

  • Haben Sie Datenstreaming-Optionen für die Datenaufnahme?

  • Wie führt man eine Datentransformation für Batch- und Echtzeitdaten durch?

  • Wie verwalten Sie die Orchestrierung von Workflows zur Datentransformation?

  • Welche Aktivitäten führen Sie am häufigsten durch: Datenermittlung und Katalogisierung, Datenaufnahme, Datentransformation, Unterstützung von Geschäftsanalysten, Unterstützung von Datenwissenschaftlern, Datenverwaltung, Schulung von Teams und Benutzern?

  • Wenn ein Datensatz erstellt wird, wie wird er aus Datenschutzgründen klassifiziert? Wie reinigen Sie es, damit es für Ihre internen Verbraucher aussagekräftig ist?

  • Sind Datenverwaltung und Datenverwaltung zentralisiert oder dezentralisiert?

  • Wie setzt man Data Governance durch? Haben Sie einen automatisierten Prozess?

  • Wer ist der Eigentümer und Verwalter der Daten in jeder Phase der Pipeline: Datenaufnahme, Datenverarbeitung, Datenaustausch und Datennutzung? Gibt es ein Datendomain-Konzept zur Bestimmung von Eigentümern und Verwaltern?

  • Was sind die größten Herausforderungen bei der gemeinsamen Nutzung von Datensätzen innerhalb des Unternehmens mit Zugriffskontrolle?

  • Verwenden Sie Infrastructure as Code (IaC), um Datenpipelines bereitzustellen und zu verwalten?

  • Haben Sie eine Data-Lake-Strategie? 

    • Ist Ihr Data Lake im gesamten Unternehmen verteilt oder zentralisiert? 

  • Wie ist Ihr Datenkatalog organisiert? Gilt es unternehmensweit oder pro Bereich?

  • Haben Sie einen Data Lakehouse-Ansatz eingeführt?

  • Verwenden Sie Data-Mesh-Konzepte oder planen Sie, diese zu verwenden?

Sie können diese Fragen ergänzen mitAWSDatenanalyse-Linse mit durchdachtem Framework.

Geschäftsanalyseteam

  • Wie würden Sie die folgenden Merkmale der Daten beschreiben, die für Ihre Arbeit verfügbar sind:

    • Sauberkeit

    • Qualität

    • Klassifizierung

    • Metadaten

    • Geschäftliche Bedeutung

  • Nimmt Ihr Team an den Definitionen von Datensätzen in Ihrem Bereich im Geschäftsglossar teil?

  • Welche Auswirkungen hat es, wenn Sie nicht über die Daten verfügen, die Sie für Ihre Arbeit benötigen, zu dem Zeitpunkt, zu dem Sie sie benötigen?

  • Haben Sie Beispiele für Szenarien, in denen Sie keinen Zugriff auf Daten haben oder es zu lange dauert, bis Sie die Daten erhalten haben? Wie lange dauert es, bis Sie die benötigten Daten erhalten haben?

  • Wie oft verwenden Sie einen kleineren Datensatz, als Sie aufgrund technischer Probleme oder aufgrund der Verarbeitungszeit benötigen?

  • Haben Sie eine Sandbox-Umgebung mit der Skalierung und den Tools, die Sie benötigen?

  • Können Sie A/B-Tests durchführen, um Hypothesen zu validieren?

  • Fehlen Ihnen Werkzeuge, die Sie für Ihre Arbeit benötigen?

    • Welche Arten von Tools?

    • Warum sind sie nicht verfügbar?

  • Gibt es wichtige Aktivitäten, für die Sie keine Zeit haben?

  • Welche Aktivitäten nehmen Ihre Zeit am meisten in Anspruch?

  • Wie werden Ihre Geschäftsansichten aktualisiert?

    • Werden sie automatisch geplant und verwaltet?

  • In welchen Szenarien würden Sie Daten benötigen, die aktueller sind als die Daten, die Sie erhalten?

  • Wie teilt man Analysen? Welche Tools und Prozesse nutzt du für das Teilen?

  • Entwickeln Sie häufig neue Datenprodukte und stellen sie anderen Teams zur Verfügung?

    • Wie sieht Ihr Prozess für die gemeinsame Nutzung von Datenprodukten mit anderen Geschäftsbereichen oder im gesamten Unternehmen aus?

Data-Science-Teams (zur Festlegung des Modelleinsatzes)

  • Wie würden Sie die folgenden Merkmale der Daten beschreiben, die für Ihre Arbeit verfügbar sind:

    • Sauberkeit

    • Qualität

    • Klassifizierung

    • Metadaten

    • Bedeutung

  • Haben Sie automatisierte Tools zum Trainieren, Testen und Bereitstellen von Modellen für maschinelles Lernen (ML)?

  • Haben Sie Optionen für die Maschinengröße, um jeden Schritt bei der Erstellung und Bereitstellung eines ML-Modells durchzuführen?

  • Wie werden die ML-Modelle produziert?

  • Was sind die Schritte zur Implementierung eines neuen Modells? Wie automatisiert sind sie?

  • Haben Sie die Komponenten, um ML-Modelle für Batch- und Echtzeitdaten zu trainieren, zu testen und bereitzustellen? 

  • Können Sie einen Datensatz verwenden und verarbeiten, der groß genug ist, um die Daten darzustellen, die Sie für die Erstellung des Modells benötigen?

  • Wie überwachen Sie Ihre Modelle und ergreifen Maßnahmen, um sie umzuschulen?

  • Wie messen Sie die Auswirkungen der Modelle auf Ihr Unternehmen?

  • Können Sie A/B-Tests durchführen, um Hypothesen für Geschäftsteams zu validieren?

Weitere Fragen finden Sie in derAWSWell Architected Framework Lens, Linse für maschinelles Lernen.