As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Hiperparâmetros do k-means
Na solicitação CreateTrainingJob
, é especificado o algoritmo de treinamento que você deseja utilizar. Você também pode especificar hiperparâmetros específicos do algoritmo como mapas. string-to-string A tabela a seguir lista os hiperparâmetros do algoritmo de treinamento k-means fornecido pela Amazon. SageMaker Para obter mais informações sobre como funciona o clustering de k-means, consulte Como funciona o clustering do k-means.
Nome do parâmetro | Descrição |
---|---|
feature_dim |
O número de recursos nos dados de entrada. Obrigatório Valores válidos: inteiro positivo |
k |
O número de clusters necessários. Obrigatório Valores válidos: inteiro positivo |
epochs |
O número de passagens realizadas nos dados de treinamento. Opcional Valores válidos: inteiro positivo Valor padrão: 1 |
eval_metrics |
Uma lista JSON de tipos de métrica usadas para relatar uma pontuação para o modelo. Os valores permitidos são Opcional Valores válidos: Valor padrão: |
extra_center_factor |
O algoritmo cria os centros K = Opcional Valores válidos: um número inteiro positivo ou Valor padrão: |
half_life_time_size |
Usado para determinar o peso dado a uma observação ao calcular uma média de cluster. Esse peso decai exponencialmente à medida que mais pontos são observados. Quando um ponto é observado pela primeira vez, é atribuído um peso de 1 ao calcular a média do cluster. A constante de degradação para a função de decaimento exponencial é escolhida de modo que após observar Opcional Valores válidos: inteiro não negativo Valor padrão: 0 |
init_method |
Método pelo qual o algoritmo escolhe os centros de cluster iniciais. A abordagem k-means padrão as escolhe aleatoriamente. Um método alternativo k-means++ escolhe o primeiro centro de cluster aleatoriamente. Em seguida, ele distribui a posição dos demais grupos iniciais ponderando a seleção de centros com uma distribuição de probabilidade proporcional ao quadrado da distância dos demais pontos de dados dos centros existentes. Opcional Valores válidos: Valor padrão: |
local_lloyd_init_method |
O método de inicialização para o procedimento de maximização da expectativa (EM) de Lloyd utilizado para construir o modelo final contendo Opcional Valores válidos: Valor padrão: |
local_lloyd_max_iter |
O número máximo de iterações para o procedimento de maximização da expectativa (EM) de Lloyd utilizado para construir o modelo final contendo Opcional Valores válidos: inteiro positivo Valor padrão: 300 |
local_lloyd_num_trials |
O número de vezes que o procedimento de maximização da expectativa (EM) de Lloyd com a menor perda é executado ao construir o modelo final contendo Opcional Valores válidos: um número inteiro positivo ou Valor padrão: |
local_lloyd_tol |
A tolerância para a mudança na perda de interrupção precoce do procedimento de maximização da expectativa (EM) de Lloyd utilizada para construir o modelo final contendo Opcional Valores válidos: flutuante. Intervalo em [0, 1]. Valor padrão: 0.0001 |
mini_batch_size |
O número de observações por minilote para o iterador de dados. Opcional Valores válidos: inteiro positivo Valor padrão: 5000 |