Como funciona a classificação de imagens

O algoritmo de classificação de imagens pega uma imagem como entrada e a classifica em uma das categorias de saída. O deep learning revolucionou o domínio da classificação de imagens e obteve excelente desempenho. Várias redes de aprendizado profundo ResNet, como, DenseNet, Inception e assim por diante, foram desenvolvidas para serem altamente precisas na classificação de imagens. Ao mesmo tempo, houve esforços para coletar dados de imagem rotulados que são essenciais para treinar essas redes. ImageNeté um desses grandes conjuntos de dados que tem mais de 11 milhões de imagens com cerca de 11.000 categorias. Depois que uma rede é treinada com ImageNet dados, ela também pode ser usada para generalizar com outros conjuntos de dados, por meio de um simples reajuste ou ajuste fino. Nessa abordagem de aprendizado por transferência, uma rede é inicializada com pesos (neste exemplo, treinados ImageNet), que podem ser posteriormente ajustados para uma tarefa de classificação de imagens em um conjunto de dados diferente.

A classificação de imagens na Amazon SageMaker pode ser executada em dois modos: treinamento completo e aprendizado por transferência. No modo de treinamento completo, a rede é inicializada com pesos aleatórios e treinada nos dados do usuário do zero. No modo de aprendizagem de transferência, a rede é inicializada com pesos pré-treinados, e apenas a camada superior totalmente conectada é inicializada com pesos aleatórios. Em seguida, toda a rede é aperfeiçoada com novos dados. Nesse modo, o treinamento pode ser obtido mesmo com um conjunto de dados menor. Isso ocorre porque a rede já está treinada e, portanto, pode ser usada em situações de dados de treinamento insuficientes.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Classificação de imagens: MXNet

Hiperparâmetros