Optimieren eines IP Insights-Modells - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Optimieren eines IP Insights-Modells

Die automatische Modelloptimierung, auch als Hyperparameteroptimierung bezeichnet, sucht die beste Version eines Modells durch Ausführen vieler Aufträge, die eine Reihe von Hyperparametern in Ihrem Datensatz testen. Sie wählen die optimierbaren Hyperparameter, eine Reihe von Werten für jeden Parameter und eine objektive Metrik aus. Sie wählen die objektive Metrik aus den Metriken aus, die der Algorithmus berechnet. Die automatische Modelloptimierung durchsucht die ausgewählten Hyperparameter nach der Kombination von Werten, die das Modell ergeben, das die objektive Metrik optimiert.

Mehr Informationen über die Modelloptimierung finden Sie unter Führen Sie eine automatische Modelloptimierung durch mit SageMaker.

Vom IP Insights-Algorithmus berechnete Metriken

Der Amazon SageMaker IP Insights-Algorithmus ist ein unbeaufsichtigter Lernalgorithmus, der Zusammenhänge zwischen IP-Adressen und Entitäten lernt. Der Algorithmus trainiert ein Diskriminatormodell, das lernt, separate beobachtete Datenpunkte (positive Stichproben) von zufällig generierte Datenpunkten (negative Stichproben) zu trennen. Die automatische Modelloptimierung in IP Insights unterstützt Sie dabei, das Modell zu finden, das zwischen unbezeichneten Validierungsdaten und automatisch generierten negativen Stichproben genau unterscheiden kann. Die Modellgenauigkeit im Validierungsdatensatz wird anhand der Fläche unter der Receiver Operating Characteristic-Kurve gemessen. Diese validation:discriminator_auc-Metrik kann Werte zwischen 0,0 und 1,0 annehmen, wobei 1,0 perfekte Genauigkeit bedeutet.

Der IP Insights-Algorithmus berechnet eine validation:discriminator_auc-Metrik während der Validierung. Der entsprechende Wert wird als objektive Funktion zur Unterstützung der Hyperparameter-Optimierung verwendet.

Metrikname Beschreibung Optimierungsrichtung
validation:discriminator_auc

Die Fläche unter der Receiver Operating Characteristic-Kurve auf dem Validierungsdatensatz. Der Validierungsdatensatz ist nicht bezeichnet. Die Fläche unter der Kurve (Area Under the Curve, AUC) ist eine Metrik zur Beschreibung der Fähigkeit des Modells, Validierungsdatenpunkte von zufällig generierten Datenpunkten zu unterscheiden.

Maximieren

Optimierbare IP Insights-Hyperparameter

Sie können die folgenden Hyperparameter für den SageMaker IP Insights-Algorithmus einstellen.

Name des Parameters Parametertyp Empfohlene Bereiche
epochs

IntegerParameterRange

MinValue: 1, MaxValue: 10

learning_rate

ContinuousParameterRange

MinValue: 1e-4, MaxValue: 0,1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue: 5000

num_entity_vectors

IntegerParameterRanges

MinValue: 10000, MaxValue: 100000

num_ip_encoder_layers

IntegerParameterRanges

MinValue: 1, MaxValue: 10

random_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue: 10

shuffled_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue: 10

vector_dim

IntegerParameterRanges

MinValue: 8, MaxValue: 256

weight_decay

ContinuousParameterRange

MinValue: 0,0, MaxValue: 1,0