Ajustar um modelo k-NN - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Ajustar um modelo k-NN

O algoritmo dos SageMaker k-vizinhos mais próximos da Amazon é um algoritmo supervisionado. O algoritmo consome um conjunto de dados de teste e emite uma métrica sobre a precisão para uma tarefa de classificação ou sobre o erro quadrático médio para uma tarefa de regressão. Essas métricas de precisão comparam as previsões do modelo de suas respectivas tarefas com a verdade básica fornecida pelos dados de teste empíricos. Para encontrar o melhor modelo que reporta a maior precisão ou o menor erro no conjunto de dados de teste, execute um trabalho de ajuste de hiperparâmetros para k-NN.

O ajuste automático de modelos, também conhecido como ajuste de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados. Você escolhe os hiperparâmetros ajustáveis, um intervalo de valores para cada um e uma métrica objetiva. Você escolhe a métrica objetiva adequada para a tarefa de previsão do algoritmo. O ajuste de modelo automático pesquisa os hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica objetiva. Os hiperparâmetros são usados apenas para ajudar a estimar os parâmetros do modelo e não são usados pelo modelo treinado para fazer previsões.

Para mais informações sobre o ajuste de modelos, consulte Ajuste automático do modelo com SageMaker.

Métricas calculadas pelo algoritmo k-NN

O algoritmo k-nearest neighbors computa uma das duas métricas na tabela a seguir durante o treinamento, dependendo do tipo de tarefa especificado pelo hiperparâmetro predictor_type.

  • classificador especifica uma tarefa de classificação e computa test:accuracy

  • regressor especifica uma tarefa de regressão e computa test:mse.

Escolha o valor predictor_type apropriado para o tipo de tarefa realizada para calcular a métrica objetiva relevante ao ajustar um modelo.

Nome da métrica Descrição Direção de otimização
test:accuracy

Quando predictor_type está definido como classificador, k-NN compara o rótulo previsto, com base na média dos rótulos dos k vizinhos mais próximos, com o rótulo de verdade de terreno fornecido nos dados do canal de teste. A precisão relatada varia de 0,0 (0%) a 1,0 (100%).

Maximizar

test:mse

Quando predictor_type está definido como regressor, k-NN compara o rótulo previsto, com base na média dos rótulos dos k vizinhos mais próximos, com o rótulo de verdade de terreno fornecido nos dados do canal de teste. O erro quadrático médio é calculado comparando os dois rótulos.

Minimizar

Hiperparâmetros ajustáveis de k-NN

Ajuste o modelo do SageMaker vizinho mais próximo da Amazon com os seguintes hiperparâmetros.

Nome do parâmetro Tipo de parâmetro Intervalos recomendados
k

IntegerParameterRanges

MinValue: 1, MaxValue 1024

sample_size

IntegerParameterRanges

MinValue: 256, MaxValue 2000000