Entitäten für die Herkunft - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Entitäten für die Herkunft

Tracking-Entitäten behalten eine Darstellung aller Elemente Ihrer end-to-end Machine Learning-Workflow Sie können diese Darstellung verwenden, um Model-Governance einzurichten, Ihren Workflow zu reproduzieren und eine Aufzeichnung Ihrer Arbeitshistorie zu führen.

Amazon SageMaker erstellt automatisch Tracking-Entitäten für Testkomponenten und deren zugehörige Studien und Experimente, wenn Sie erstellen SageMaker Jobs wie die Verarbeitung von Aufträgen, Schulungsaufträge und Stapeltransformationsaufträge. Zusätzlich zum auto Tracking können Sie auchTracking Entities manuell erstellenSie können benutzerdefinierte Schritte in Ihrem Workflow modellieren. Weitere Informationen finden Sie unter Verwalten von Machine Learning mit Amazon SageMaker -Experimente.

SageMaker erstellt auch automatisch Tracking-Entitäten für die anderen Schritte in einem Workflow, damit Sie den Workflow von Ende zu Ende verfolgen können. Weitere Informationen finden Sie unter Amazon SageMaker — Erstellt Tracking-Entitä.

Sie können zusätzliche Entitäten erstellen, um die von SageMaker erstellten Einheiten zu ergänzen Weitere Informationen finden Sie unter Tracking Entities manuell erstellen.

SageMaker verwendet vorhandene Entitäten erneut, anstatt neue zu erstellen. Zum Beispiel kann es nur ein Artefakt mit einem Unikat gebenSourceUriaus.

Schlüsselkonzepte zum Abfragen der Abstammung

  • Abstammung— Metadaten, die die Beziehungen zwischen verschiedenen Entitäten in Ihren ML-Workflows verfolgen.

  • QueryLineAge— Die Aktion, um Ihre Abstammung zu untersuchen und Beziehungen zwischen Entitäten zu ermitteln.

  • Abstammungseinheiten— Die Metadatenelemente, aus denen Ihre Abstammung besteht.

  • Kontoübergreifende Abstammung— Ihr ML-Workflow umfasst möglicherweise mehrere -Konten. Mit kontoübergreifender Abstammung können Sie mehrere Konten konfigurieren, um automatisch Abstammungszuordnungen zwischen Ressourcen für gemeinsam genutzte Entitäten zu erstellen. QueryLineage können dann Entitäten sogar von diesen freigegebenen Konten zurückgeben.

Die folgenden Tracking-Entitäten sind definiert:

Experimenten-Einheiten

  • Test-Komponente— Eine Phase einer Studie zum maschinellen Lernen. Umfasst die Verarbeitung von Aufträgen, Schulungsaufträgen und Stapeltransformationsaufträgen.

  • Testversion— Eine Kombination von Versuchskomponenten, die im Allgemeinen ein Modell erzeugen.

  • Experiment— Eine Gruppierung von Studien, die sich im Allgemeinen auf die Lösung eines bestimmten Anwendungsfalls konzentrieren.

Abstammungseinheiten

  • Testkomponente— Stellt Verarbeitungs-, Schulungs- und Transformationsaufträge in der Abstammung dar. Auch Teil des Experimentmanagements.

  • Kontext— Bietet eine logische Gruppierung anderer Tracking- oder Experimententitäten. Konzeptionell sind Experimente und Studien Kontexte. Einige Beispiele sind ein Endpunkt und ein Modellpaket.

  • Action— Stellt eine Aktion oder Aktivität dar. Im Allgemeinen beinhaltet eine Aktion mindestens ein Eingabeartefakt oder ein Ausgabeartefakt. Einige Beispiele sind ein Workflow-Schritt und eine Modellbereitstellung.

  • Artefakt— Stellt ein URI-Adressierbares Objekt oder Daten dar. Ein Artefakt ist im Allgemeinen entweder eine Eingabe oder eine Ausgabe für eine Testkomponente oder Aktion. Einige Beispiele sind ein Datensatz (S3-Bucket-URI) oder ein Image (Amazon ECR-Registrierungspfad).

  • Zuordnung— Verknüpft andere Tracking- oder Experimentiereinheiten, z. B. eine Verknüpfung zwischen dem Standort von Trainingsdaten und einem Ausbildungsjob.

    Ein Verband hat eine optionaleAssociationTypeeigentum. Die folgenden Werte stehen zusammen mit der vorgeschlagenen Verwendung für jeden Typ zur Verfügung. SageMaker legt keine Beschränkungen für ihre Verwendung ein:

    • ContributedTo— Die Quelle trug zum Ziel bei oder war an der Aktivierung des Ziels beteiligt. Zum Beispiel trugen die Trainingsdaten zum Ausbildungsjob bei.

    • AssociatedWith— Die Quelle ist mit dem Ziel verbunden. Beispielsweise ist ein Genehmigungsworkflow mit einer Modellbereitstellung verknüpft.

    • DerivedFrom- Das Ziel ist eine Änderung der Quelle. Beispielsweise wird eine Digest-Ausgabe eines Kanaleingangs für einen Verarbeitungsauftrag von den ursprünglichen Eingaben abgeleitet.

    • Produced— Die Quelle hat das Ziel generiert. Zum Beispiel produzierte ein Ausbildungsjob ein Modellartefakt.

    • SameAs— Wenn dieselbe Abstammungseinheit in verschiedenen Konten verwendet wird.

Häufige Eigenschaften

  • Type-Eigenschaft

    Die Aktions-, Artefakt- und Kontextitäten haben eineArteigentum,ActionType,ArtifactType, undContextTypebeziehungsweise. Diese Eigenschaft ist eine benutzerdefinierte Zeichenfolge, die aussagekräftige Informationen mit der Entität verknüpfen und als Filter in den Listen-APIs verwendet werden kann.

  • Source-Eigenschaft

    Die Aktions-, Artefakt- und Kontextitäten haben eineSourceeigentum. Diese Eigenschaft liefert den zugrunde liegenden URI, den die Entität darstellt. Hier einige Beispiele:

    • Importieren in &S3;UpdateEndpointAktion wo die Quelle istEndpointArnaus.

    • Ein Bildartefakt für einen Verarbeitungsauftrag, bei dem die QuelleImageUriaus.

    • Importieren in &S3;EndpointKontext, in dem die Quelle derEndpointArnaus.

  • Metadaten-Eigenschaft

    Die Aktions- und Artefakt-Entitäten haben eineMetadata-Eigenschaft, die folgenden Informationen enthalten können:

    • ProjectId— Zum Beispiel die ID des SageMaker mLOPS-Projekt, zu dem ein Modell gehört.

    • GeneratedBy— Beispiel die SageMaker Pipeline-Ausführung, die eine Modellpaketversion registriert hat.

    • Repository— Zum Beispiel das Repository, das einen Algorithmus enthält.

    • CommitId— Zum Beispiel die Commit-ID einer Algorithmusversion.