Was ist ein Projekt? SageMaker - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Was ist ein Projekt? SageMaker

SageMaker Projekte helfen Unternehmen dabei, Entwicklerumgebungen für Datenwissenschaftler und CI/CD-Systeme für MLOps-Ingenieure einzurichten und zu standardisieren. Projekte helfen Unternehmen auch bei der Einrichtung von Abhängigkeitsmanagement, Code-Repository-Management, Build-Reproduzierbarkeit und Artefakt-Sharing.

Sie können SageMaker Projekte aus dem AWS Service Catalog mithilfe benutzerdefinierter oder SageMaker bereitgestellter Vorlagen bereitstellen. Informationen zum AWS Service Catalog finden Sie unter Was ist AWS Service Catalog. Mit SageMaker Projects können MLOp-Techniker und Unternehmensadministratoren ihre eigenen Vorlagen definieren oder von ihnen bereitgestellte Vorlagen verwenden SageMaker. Mit den SageMaker bereitgestellten Vorlagen wird der ML-Workflow mit Quellversionskontrolle, automatisierten ML-Pipelines und einer Reihe von Code beschleunigt, sodass Sie schnell mit der Bearbeitung von ML-Anwendungsfällen beginnen können.

Wann sollten Sie ein Projekt verwenden? SageMaker

Notebooks sind zwar hilfreich bei der Modellbildung und beim Experimentieren, aber ein Team von Datenwissenschaftlern und ML-Ingenieuren, die Code gemeinsam nutzen, benötigt eine skalierbarere Methode, um die Codekonsistenz und eine strenge Versionskontrolle aufrechtzuerhalten.

Jede Organisation hat ihre eigenen Standards und Verfahren, die für Sicherheit und Steuerung ihrer AWS Umgebung sorgen. SageMaker bietet eine Reihe von Vorlagen von Erstanbietern für Unternehmen, die schnell mit ML-Workflows und CI/CD beginnen möchten. Die Vorlagen enthalten Projekte, die AWS-native Dienste für CI/CD verwenden, wie, und. AWS CodeBuild AWS CodePipeline AWS CodeCommit Die Vorlagen bieten auch die Möglichkeit, Projekte zu erstellen, die Tools von Drittanbietern wie Jenkins und verwenden. GitHub Eine Liste der bereitgestellten Projektvorlagen finden Sie SageMaker unter. Verwenden Sie von SageMaker uns bereitgestellte Projektvorlagen

Organizations benötigen häufig eine strenge Kontrolle über die MLOP-Ressourcen, die sie bereitstellen und verwalten. Diese Verantwortung beinhaltet bestimmte Aufgaben, darunter die Konfiguration von IAM-Rollen und -Richtlinien, die Durchsetzung von Ressourcen-Tags, die Durchsetzung von Verschlüsselung und die Entkopplung von Ressourcen über mehrere Konten hinweg. SageMaker Projekte können all diese Aufgaben durch benutzerdefinierte Vorlagenangebote unterstützen, bei denen Organisationen AWS CloudFormation Vorlagen verwenden, um die für einen ML-Workflow benötigten Ressourcen zu definieren. Datenwissenschaftler können eine Vorlage für das Bootstrap auswählen und ihren ML-Workflow vorkonfigurieren. Diese benutzerdefinierten Vorlagen werden als Service Catalog-Produkte erstellt und Sie können sie in der Studio- oder Studio Classic-Benutzeroberfläche unter Organisationsvorlagen bereitstellen. Der Service Catalog ist ein Service, der Unternehmen bei der Erstellung und Verwaltung von Produktkatalogen unterstützt, die für die Verwendung zugelassen sind. AWS Weitere Informationen zum Erstellen benutzerdefinierter Vorlagen finden Sie unter Benutzerdefinierte SageMaker Projektvorlagen erstellen — Bewährte Methoden.

SageMaker Projekte können dir helfen, deine Git-Repositorys zu verwalten, sodass du teamübergreifend effizienter zusammenarbeiten, die Codekonsistenz sicherstellen und CI/CD unterstützen kannst. SageMaker Projekte können dir bei den folgenden Aufgaben helfen:

  • Organisieren Sie alle Entitäten des ML-Lebenszyklus in einem Projekt.

  • Richten Sie mit nur einem Klick eine standardmäßige ML-Infrastruktur für Modelltraining und -bereitstellung ein, die bewährte Verfahren beinhaltet.

  • Erstellen und teilen Sie Vorlagen für die ML-Infrastruktur für mehrere Anwendungsfälle.

  • Nutzen Sie die SageMaker bereitgestellten vorgefertigten Vorlagen, um sich schnell auf die Modellerstellung zu konzentrieren, oder erstellen Sie benutzerdefinierte Vorlagen mit unternehmensspezifischen Ressourcen und Richtlinien.

  • Integrieren Sie die Tools Ihrer Wahl, indem Sie die Projektvorlagen erweitern. Ein Beispiel finden Sie unter Erstellen eines SageMaker Projekts für die Integration mit und Pipelines. GitLab GitLab

  • Organisieren Sie alle Entitäten des ML-Lebenszyklus in einem Projekt.

Was ist in einem SageMaker Projekt enthalten?

Kunden haben die Flexibilität, ihre Projekte mit den Ressourcen einzurichten, die für ihren Anwendungsfall am besten geeignet sind. Das folgende Beispiel zeigt das MLOps-Setup für einen ML-Workflow, einschließlich Modelltraining und -bereitstellung.

Ein ML-Workflow-Diagramm für eine Pipeline, das Schritte zur Modellschulung und Bereitstellung umfasst.

Ein typisches Projekt mit einer SageMaker bereitgestellten Vorlage könnte Folgendes beinhalten:

  • Ein oder mehrere Repositorys mit Beispielcode zum Erstellen und Bereitstellen von ML-Lösungen. Dies sind funktionierende Beispiele, die Sie an Ihre Bedürfnisse anpassen können. Sie besitzen diesen Code und können die versionskontrollierten Repositorys für Ihre Aufgaben nutzen.

  • Eine SageMaker Pipeline, die Schritte für die Datenvorbereitung, das Training, die Modellevaluierung und die Modellbereitstellung definiert, wie in der folgenden Abbildung dargestellt.

    Eine SageMaker Pipeline mit Schritten zur Datenvorbereitung, Schulung, Modellevaluierung und Modellbereitstellung.
  • Eine CodePipeline oder Jenkins-Pipeline, die Ihre SageMaker Pipeline jedes Mal ausführt, wenn Sie eine neue Version des Codes einchecken. Informationen zu finden Sie CodePipeline unter Was ist. AWS CodePipeline Informationen zu Jenkins finden Sie in der Jenkins-Benutzerdokumentation.

  • Eine Modellgruppe, die Modellversionen enthält. Jedes Mal, wenn Sie die aus einem SageMaker Pipeline-Lauf resultierende Modellversion genehmigen, können Sie sie auf einem SageMaker Endpunkt bereitstellen.

Jedes SageMaker Projekt hat einen eindeutigen Namen und eine eindeutige ID, die als Tags auf alle im Projekt erstellten AWS Ressourcen angewendet werden. SageMaker Mit dem Namen und der ID können Sie alle Entitäten anzeigen, die mit Ihrem Projekt verknüpft sind. Dazu zählen:

  • Pipelines

  • Registrierte Modelle

  • Bereitgestellte Modelle (Endpunkte)

  • Datensätze

  • Service Catalog

  • CodePipeline und Jenkins-Pipelines

  • CodeCommit und Git-Repositorys von Drittanbietern

Muss ich ein Projekt erstellen, um SageMaker Pipelines verwenden zu können?

Nein. SageMaker Pipelines sind eigenständige Einheiten, genau wie Schulungsjobs, Verarbeitungsjobs und andere SageMaker Jobs. Sie können Pipelines direkt in einem Notebook erstellen, aktualisieren und ausführen, indem Sie das SageMaker Python-SDK verwenden, ohne ein SageMaker Projekt zu verwenden.

Projekte bieten eine zusätzliche Ebene, die Ihnen hilft, Ihren Code zu organisieren und betriebliche Best Practices zu übernehmen, die Sie für ein System mit Produktionsqualität benötigen.