As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Preparação e importação de dados em massa usando o Amazon SageMaker Data Wrangler
Importante
Ao usar o Data Wrangler, você incorre SageMaker em custos. Para obter uma lista completa de cobranças e preços, consulte a guia Data Wrangler dos preços da Amazon SageMaker
Depois de criar um grupo de conjuntos de dados, você pode usar o Amazon SageMaker Data Wrangler (Data Wrangler) para importar dados de mais de 40 fontes para um conjunto de dados do Amazon Personalize. O Data Wrangler é um recurso do Amazon SageMaker Studio Classic que fornece uma end-to-end solução para importar, preparar, transformar e analisar dados. Não é possível usar o Data Wrangler para preparar e importar dados para um conjunto de dados de ações nem de interações com ações.
Ao usar o Data Wrangler para preparar e importar dados, você usa um fluxo de dados. Um fluxo de dados define uma série de etapas de preparação de dados de machine learning, começando com a importação de dados. Cada vez que você adiciona uma etapa ao seu fluxo, o Data Wrangler executa uma ação em seus dados, como transformá-los ou gerar uma visualização.
Veja abaixo algumas etapas que você pode adicionar ao fluxo para preparar dados para o Amazon Personalize:
-
Insights: você pode adicionar etapas de insights específicas do Amazon Personalize ao seu fluxo. Esses insights podem ajudar você a aprender sobre seus dados e quais ações você pode tomar para melhorá-los.
-
Visualizações: você pode adicionar etapas de visualização para gerar gráficos, como histogramas e gráficos de dispersão. Os gráficos podem ajudar você a descobrir problemas em seus dados, como valores discrepantes ou valores ausentes.
-
Transformações: você pode usar as etapas de transformação específicas e gerais do Amazon Personalize para garantir que seus dados atendam aos requisitos do Amazon Personalize. A transformação do Amazon Personalize ajuda você a mapear suas colunas de dados para as colunas necessárias, dependendo do tipo de conjunto de dados do Amazon Personalize.
Se precisar sair do Data Wrangler antes de importar dados para o Amazon Personalize, você pode retomar de onde parou escolhendo o mesmo tipo de conjunto de dados ao iniciar o Data Wrangler no console do Amazon Personalize. Ou você pode acessar o Data Wrangler diretamente pelo SageMaker Studio Classic.
Recomendamos que você importe dados do Data Wrangler para o Amazon Personalize da seguinte forma. As etapas de transformação, visualização e análise são opcionais, repetíveis e podem ser concluídas em qualquer ordem.
-
Configurar permissões - Configure permissões para o Amazon Personalize e funções de SageMaker serviço. E configure permissões para seus usuários.
-
Inicie o Data Wrangler no SageMaker Studio Classic a partir do console Amazon Personalize - Use o console Amazon Personalize para configurar SageMaker um domínio e iniciar o Data Wrangler no Studio Classic. SageMaker
-
Importar seus dados para o Data Wrangler - Importe dados de mais de 40 fontes para o Data Wrangler. As fontes incluem AWS serviços, como Amazon Redshift, Amazon ou Amazon AthenaEMR, e terceiros, como Snowflake ou. DataBricks
-
Transformar seus dados - Use o Data Wrangler para transformar seus dados e atender aos requisitos do Amazon Personalize.
-
Visualizar e analisar seus dados - Use o Data Wrangler para visualizar seus dados e analisá-los por meio de insights específicos do Amazon Personalize.
-
Processe e importe dados para o Amazon Personalize - Use um notebook SageMaker Studio Classic Jupyter para importar seus dados processados para o Amazon Personalize.
Mais informações
Os recursos a seguir fornecem informações adicionais sobre o uso do Amazon SageMaker Data Wrangler e do Amazon Personalize.
-
Para ver um tutorial que orienta você no processamento e na transformação de um conjunto de dados de amostra, consulte Demonstração: Passo a passo do conjunto de dados do Data Wrangler Titanic no Amazon Developer Guide. SageMaker Este tutorial apresenta os campos e as funções do Data Wrangler.
-
Para obter informações sobre a integração aos SageMaker domínios da Amazon, consulte Integração rápida ao SageMaker domínio da Amazon no Amazon Developer Guide. SageMaker
-
Para obter informações sobre os requisitos de dados do Amazon Personalize, consulte. Preparando dados de treinamento para o Amazon Personalize