Preparação e importação de dados em massa usando o Amazon SageMaker Data Wrangler - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Preparação e importação de dados em massa usando o Amazon SageMaker Data Wrangler

Importante

Ao usar o Data Wrangler, você incorre SageMaker em custos. Para obter uma lista completa de cobranças e preços, consulte a guia Data Wrangler dos preços da Amazon SageMaker . Para evitar taxas adicionais, ao terminar, desligue sua instância do Data Wrangler. Para obter mais informações, consulte Desligar o Data Wrangler.

Depois de criar um grupo de conjuntos de dados, você pode usar o Amazon SageMaker Data Wrangler (Data Wrangler) para importar dados de mais de 40 fontes para um conjunto de dados do Amazon Personalize. O Data Wrangler é um recurso do Amazon SageMaker Studio Classic que fornece uma end-to-end solução para importar, preparar, transformar e analisar dados. Não é possível usar o Data Wrangler para preparar e importar dados para um conjunto de dados de ações nem de interações com ações.

Ao usar o Data Wrangler para preparar e importar dados, você usa um fluxo de dados. Um fluxo de dados define uma série de etapas de preparação de dados de machine learning, começando com a importação de dados. Cada vez que você adiciona uma etapa ao seu fluxo, o Data Wrangler executa uma ação em seus dados, como transformá-los ou gerar uma visualização.

Veja abaixo algumas etapas que você pode adicionar ao fluxo para preparar dados para o Amazon Personalize:

  • Insights: você pode adicionar etapas de insights específicas do Amazon Personalize ao seu fluxo. Esses insights podem ajudar você a aprender sobre seus dados e quais ações você pode tomar para melhorá-los.

  • Visualizações: você pode adicionar etapas de visualização para gerar gráficos, como histogramas e gráficos de dispersão. Os gráficos podem ajudar você a descobrir problemas em seus dados, como valores discrepantes ou valores ausentes.

  • Transformações: você pode usar as etapas de transformação específicas e gerais do Amazon Personalize para garantir que seus dados atendam aos requisitos do Amazon Personalize. A transformação do Amazon Personalize ajuda você a mapear suas colunas de dados para as colunas necessárias, dependendo do tipo de conjunto de dados do Amazon Personalize.

Se precisar sair do Data Wrangler antes de importar dados para o Amazon Personalize, você pode retomar de onde parou escolhendo o mesmo tipo de conjunto de dados ao iniciar o Data Wrangler no console do Amazon Personalize. Ou você pode acessar o Data Wrangler diretamente pelo SageMaker Studio Classic.

Recomendamos que você importe dados do Data Wrangler para o Amazon Personalize da seguinte forma. As etapas de transformação, visualização e análise são opcionais, repetíveis e podem ser concluídas em qualquer ordem.

  1. Configurar permissões - Configure permissões para o Amazon Personalize e funções de SageMaker serviço. E configure permissões para seus usuários.

  2. Inicie o Data Wrangler no SageMaker Studio Classic a partir do console Amazon Personalize - Use o console Amazon Personalize para configurar SageMaker um domínio e iniciar o Data Wrangler no Studio Classic. SageMaker

  3. Importar seus dados para o Data Wrangler - Importe dados de mais de 40 fontes para o Data Wrangler. As fontes incluem AWS serviços, como Amazon Redshift, Amazon ou Amazon AthenaEMR, e terceiros, como Snowflake ou. DataBricks

  4. Transformar seus dados - Use o Data Wrangler para transformar seus dados e atender aos requisitos do Amazon Personalize.

  5. Visualizar e analisar seus dados - Use o Data Wrangler para visualizar seus dados e analisá-los por meio de insights específicos do Amazon Personalize.

  6. Processe e importe dados para o Amazon Personalize - Use um notebook SageMaker Studio Classic Jupyter para importar seus dados processados para o Amazon Personalize.

Mais informações

Os recursos a seguir fornecem informações adicionais sobre o uso do Amazon SageMaker Data Wrangler e do Amazon Personalize.