Ajustar un modelo k-NN - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ajustar un modelo k-NN

El algoritmo SageMaker de Amazon k-nearest neighbors es un algoritmo supervisado. El algoritmo consume un conjunto de datos de prueba y emite una métrica sobre la precisión para una tarea de clasificación o sobre el error cuadrático medio para una tarea de regresión. Estas métricas de precisión comparan las predicciones del modelo para sus respectivas tareas con el dato real que proporcionan los datos de prueba empíricos. Para buscar el mejor modelo que notifica la mayor precisión o menor error en el conjunto de datos de prueba, ejecute un trabajo de ajuste de hiperparámetro para k-NN.

El ajuste de modelo automático, también conocido como ajuste de hiperparámetros, encuentra la mejor versión de un modelo ejecutando muchas tareas que probar una serie de hiperparámetros en su conjunto de datos. Usted elige los hiperparámetros que pueden ajustarse, un rango de valores para cada uno de ellos y una métrica objetiva. Puede elegir la métrica objetivo adecuada para la tarea de predicción del algoritmo. El ajuste de modelo automático busca los hiperparámetros elegidos para encontrar la combinación de valores que obtienen el modelo que optimiza la métrica objetiva. Los hiperparámetros se utilizan únicamente para ayudar a calcular los parámetros del modelo y no se utilizan en el modelo capacitado para realizar predicciones.

Para obtener más información acerca del ajuste de modelos, consulte Realice un ajuste automático del modelo con SageMaker.

Métricas calculadas por el algoritmo k-NN

El algoritmo k vecinos más próximos calcula una de dos métricas en la siguiente tabla durante la capacitación en función del tipo de tarea especificado por el predictor_type hiperparámetro.

  • clasificador especifica una tarea de clasificación tarea y calcula test:accuracy

  • clasificador especifica una tarea de regresión y calcula test:mse.

Elija el valor predictor_type adecuado para el tipo de tarea empleado para calcular la métrica objetivo pertinente al ajustar un modelo.

Nombre de métrica Descripción Dirección de optimización
test:accuracy

Cuando predictor_type se establece en clasificador, k-NN compara la etiqueta predicha, en función de la media de las etiquetas de los k vecinos más próximos con el dato real que se proporciona en los datos de canal de prueba. La precisión notificada oscila entre 0,0 (0 %) y 1,0 (100 %).

Maximizar

test:mse

Cuando predictor_type se establece en regresor, k-NN compara la etiqueta predicha, en función de la media de las etiquetas de los k vecinos más próximos con la etiqueta real que se proporciona en los datos de canal de prueba. El error cuadrático medio se calcula comparando las dos etiquetas.

Minimizar

Hiperparámetros k-NN ajustables

Ajuste el modelo de vecino SageMaker más cercano k de Amazon con los siguientes hiperparámetros.

Nombre del parámetro Tipo de parámetro Intervalos recomendados
k

IntegerParameterRanges

MinValue: 1, 1024 MaxValue

sample_size

IntegerParameterRanges

MinValue: 256, MaxValue 20000000