Optimieren eines IP Insights-Modells - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Optimieren eines IP Insights-Modells

Die automatische Modelloptimierung, auch als Hyperparameter-Optimierung bezeichnet, sucht die beste Version eines Modells durch Ausführen vieler Aufträge, die eine Reihe von Hyperparametern in Ihrem Dataset testen. Sie wählen die optimierbaren Hyperparameter, eine Reihe von Werten für jeden Parameter und eine objektive Metrik aus. Sie wählen die objektive Metrik aus den Metriken aus, die der Algorithmus berechnet. Die automatische Modelloptimierung durchsucht die ausgewählten Hyperparameter nach der Kombination von Werten, die das Modell ergeben, das die objektive Metrik optimiert.

Weitere Informationen zu Modelloptimierung finden Sie unter Führen Sie eine automatische Modelloptimierung durch mit SageMaker.

Vom IP Insights-Algorithmus berechnete Metriken

Der Amazon SageMaker Der IP Insights-Algorithmus ist ein Algorithmus für unbeaufsichtigtes Lernen, der Verknüpfungen zwischen IP-Adressen und Entitäten lernt. Der Algorithmus trainiert ein Diskriminatormodell, das lernt, separate beobachtete Datenpunkte (positive Stichproben) von zufällig generierte Datenpunkten (negative Stichproben) zu trennen. Die automatische Modelloptimierung in IP Insights unterstützt Sie dabei, das Modell zu finden, das zwischen unbezeichneten Validierungsdaten und automatisch generierten negativen Stichproben genau unterscheiden kann. Die Modellgenauigkeit im Validierungsdataset wird anhand der Fläche unter der Receiver Operating Characteristic-Kurve gemessen. Diese validation:discriminator_auc-Metrik kann Werte zwischen 0,0 und 1,0 annehmen, wobei 1,0 perfekte Genauigkeit bedeutet.

Der IP Insights-Algorithmus berechnet eine validation:discriminator_auc-Metrik während der Validierung. Der entsprechende Wert wird als objektive Funktion zur Unterstützung der Hyperparameter-Optimierung verwendet.

Metrikname Beschreibung Optimierungsrichtung
validation:discriminator_auc

Die Fläche unter der Receiver Operating Characteristic-Kurve auf dem Validierungsdataset. Das Validierungsdataset ist nicht bezeichnet. Die Fläche unter der Kurve (Area Under the Curve, AUC) ist eine Metrik zur Beschreibung der Fähigkeit des Modells, Validierungsdatenpunkte von zufällig generierten Datenpunkten zu unterscheiden.

Maximieren

Optimierbare IP Insights-Hyperparameter

Sie können die folgenden Hyperparameter für SageMaker IP Insights-Algorithmus

Parametername Parametertyp Empfohlene Bereiche
epochs

IntegerParameterRange

MinValue: 1, MaxValue: 100

learning_rate

ContinuousParameterRange

MinValue: 1e-4, MaxValue: 0.1

mini_batch_size

IntegerParameterRanges

MinValue: 100 MaxValue: 50000

num_entity_vectors

IntegerParameterRanges

MinValue: 10 000, MaxValue: 1000000

num_ip_encoder_layers

IntegerParameterRanges

MinValue: 1, MaxValue: 10

random_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue: 10

shuffled_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue: 10

vector_dim

IntegerParameterRanges

MinValue: 8, MaxValue: 256

weight_decay

ContinuousParameterRange

MinValue: 0.0, MaxValue: 1,0