Visualizar seu modelo - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Visualizar seu modelo

nota

As funcionalidades a seguir estão disponíveis somente para modelos personalizados criados com conjuntos de dados tabulares. Modelos de previsão de texto de várias categorias também são excluídos.

SageMaker O Canvas fornece ferramentas para visualizar seu modelo e validar dados antes de começar a criar. As funcionalidades a seguir incluem a visualização prévia da precisão do modelo, a validação do conjunto de dados para evitar problemas ao criar o modelo e a alteração do tamanho da amostra aleatória do modelo.

Visualização prévia de um modelo

Com o Amazon SageMaker Canvas, você pode obter insights dos seus dados antes de criar um modelo escolhendo o modelo Preview. Por exemplo, você pode ver como os dados em cada coluna são distribuídos. Para modelos criados usando dados categóricos, você também pode escolher Modelo de visualização para gerar uma previsão de Precisão estimada de quão bem o modelo pode analisar seus dados. A precisão de uma Criação rápida ou Criação padrão representa o desempenho do modelo em dados reais e geralmente é maior do que a Precisão estimada.

O Amazon SageMaker Canvas processa automaticamente os valores ausentes em seu conjunto de dados enquanto constrói o modelo. Ele infere os valores ausentes usando valores adjacentes que estão presentes no conjunto de dados.

Captura de tela da guia Criar para um modelo no Canvas.

Validar dados

Antes de criar seu modelo, o SageMaker Canvas verifica seu conjunto de dados em busca de problemas que possam fazer com que sua construção falhe. Se o SageMaker Canvas encontrar algum problema, ele o avisará na página Build antes de você tentar criar um modelo.

Você pode escolher Validar dados para obter uma lista dos problemas com seu conjunto de dados. Em seguida, você pode usar os recursos de preparação de dados do SageMaker Canvas, ou suas próprias ferramentas, para corrigir seu conjunto de dados antes de iniciar uma construção. Se você não corrigir os problemas com seu conjunto de dados, sua criação falhará.

Se você fizer alterações em seu conjunto de dados para corrigir os problemas, você terá a opção de revalidar seu conjunto de dados antes de tentar uma criação. Recomendamos revalidar seu conjunto de dados antes de criar.

A tabela a seguir mostra os problemas que o SageMaker Canvas verifica em seu conjunto de dados e como resolvê-los.

Problema Resolução

Tipo de modelo errado para seus dados

Experimente outro tipo de modelo ou use um conjunto de dados diferente.

Valores ausentes na sua coluna de destino

Substitua os valores ausentes, elimine as linhas com valores ausentes ou use um conjunto de dados diferente.

Muitos rótulos exclusivos em sua coluna de destino

Verifique se você usou a coluna correta para sua coluna de destino ou use um conjunto de dados diferente.

Muitos valores não numéricos em sua coluna de destino

Escolha uma coluna de destino diferente, selecione outro tipo de modelo ou use um conjunto de dados diferente.

Um ou mais nomes de coluna contêm sublinhados duplos

Renomeie as colunas para remover sublinhados duplos e tente novamente.

Nenhuma das linhas no seu conjunto de dados está completa

Substitua os valores ausentes ou use um conjunto de dados diferente.

Muitos rótulos exclusivos para o número de linhas em seus dados

Verifique se você está usando a coluna de destino correta, aumente o número de linhas no seu conjunto de dados, consolide rótulos semelhantes ou use um conjunto de dados diferente.

Amostra aleatória

SageMaker O Canvas usa o método de amostragem aleatória para amostrar seu conjunto de dados. O método de amostra aleatória significa que cada linha tem a mesma chance de ser escolhida para a amostra. Você pode escolher uma coluna na visualização prévia para obter estatísticas resumidas para a amostra aleatória, como a média e o modo.

Por padrão, o SageMaker Canvas usa um tamanho de amostra aleatório de 20.000 linhas do seu conjunto de dados para conjuntos de dados com mais de 20.000 linhas. Para conjuntos de dados menores que 20.000 linhas, o tamanho padrão da amostra será o número de linhas no seu conjunto de dados. Você pode aumentar ou diminuir o tamanho da amostra escolhendo Amostra aleatória na guia Criar do aplicativo SageMaker Canvas. Você pode usar o controle deslizante para selecionar o tamanho da amostra desejada e, em seguida, escolher Atualizar para alterar o tamanho da amostra. O tamanho máximo da amostra que você pode escolher para um conjunto de dados é de 40.000 linhas e o tamanho mínimo da amostra é de 500 linhas. Se você escolher uma amostra grande, a visualização prévia do conjunto de dados e as estatísticas resumidas podem levar alguns minutos para serem recarregadas.

A página de Criação mostra uma visualização prévia de 100 linhas do seu conjunto de dados. Se o tamanho da amostra for do mesmo tamanho do seu conjunto de dados, a visualização prévia usará as primeiras 100 linhas do seu conjunto de dados. Caso contrário, a visualização prévia usa as primeiras 100 linhas da amostra aleatória.