Criação de uma fonte de dados com dados do Amazon Redshift (console) - Amazon Machine Learning

Não estamos mais atualizando o serviço Amazon Machine Learning nem aceitando novos usuários para ele. Essa documentação está disponível para usuários existentes, mas não estamos mais atualizando-a. Para obter mais informações, consulte O que é o Amazon Machine Learning.

Criação de uma fonte de dados com dados do Amazon Redshift (console)

O console do Amazon ML fornece duas maneiras de criar uma fonte de dados usando dados do Amazon Redshift. É possível criar uma fonte de dados preenchendo o assistente Criar fonte de dados ou, se você já tem uma fonte de dados criada a partir dos dados do Amazon Redshift, pode copiar a fonte de dados original e modificar as configurações dela. Copiar uma fonte de dados permite criar facilmente várias fontes de dados semelhantes.

Para obter informações sobre a criação de uma fonte de dados usando a API, consulte CreateDataSourceFromRedshift.

Para obter mais informações sobre os parâmetros nos procedimentos a seguir, consulte Parâmetros obrigatórios do assistente Create Datasource.

Criar uma fonte de dados (console)

Para descarregar os dados do Amazon Redshift em uma fonte de dados do Amazon ML, use o assistente Criar fonte de dados.

Para criar uma fonte de dados a partir de dados no Amazon Redshift
  1. Abra o console do Amazon Machine Learning em https://console.aws.amazon.com/machinelearning/.

  2. No painel do Amazon ML, em Entidades, escolha Criar novo... e depois Fonte de dados.

  3. Na página Entrada de dados, escolha Amazon Redshift.

  4. No assistente Create Datasource (Criar fonte de dados), em Cluster identifier (Identificador do cluster), digite o nome do cluster.

  5. Em Nome do banco de dados, digite o nome do banco de dados do Amazon Redshift.

  6. Em Database user name (Nome do usuário do banco de dados), digite o nome do usuário do banco de dados.

  7. Em Database password (Senha do banco de dados), digite a senha do banco de dados.

  8. Em IAM role (Função do IAM), escolha a função do IAM. Se você ainda não tiver uma, selecione Criar uma nova função. O Amazon ML cria um perfil do IAM para o Amazon Redshift para você.

  9. Para testar as configurações do Amazon Redshift, escolha Testar o acesso (ao lado de perfil do IAM). Se o Amazon ML não puder se conectar ao Amazon Redshift com as configurações fornecidas, você não poderá continuar a criação de uma fonte de dados. Para obter ajuda sobre a solução de problemas, consulte Solucionar erros.

  10. Em SQL query (Consulta SQL), digite a consulta SQL.

  11. Em Local do esquema, escolha se você deseja que o Amazon ML crie um esquema para você. Se você mesmo tiver criado um esquema, digite o caminho do Amazon S3 para o arquivo de esquema.

  12. Em Local de preparação do Amazon S3, digite o caminho do para o bucket, no qual você deseja que o Amazon ML coloque os dados que descarrega do Amazon Redshift.

  13. (Opcional) Em Datasource name (Nome da fonte de dados), digite um nome para a fonte de dados.

  14. Escolha Verify (Verificar). O Amazon ML verifica se ele pode se conectar ao banco de dados do Amazon Redshift.

  15. Na página Schema (Esquema), revise os tipos de dados de todos os atributos e corrija-os conforme necessário.

  16. Escolha Continue (Continuar).

  17. Se você quiser usar essa fonte de dados para criar ou avaliar um modelo de ML, em Do you plan to use this dataset to create or evaluate an ML model? (Deseja usar este conjunto de dados para criar ou avaliar um modelo de ML?), escolha Yes (Sim). Se você escolher Yes (Sim), escolha a linha de destino. Para obter mais informações sobre destinos, consulte Usar o campo targetAttributeName.

    Se você quiser usar essa fonte de dados junto com um modelo que você já criou para criar previsões, escolha No (Não).

  18. Escolha Continue (Continuar).

  19. Em Does your data contain an identifier? (Os dados contêm um identificador?), se os dados não contiverem um identificador de linha, escolha No (Não).

    Se os dados contiverem um identificador de linha, escolha Yes (Sim). Para obter informações sobre identificadores de linha, consulte Usar o campo rowID.

  20. Escolha Review (Revisar).

  21. Na página Review (Rever), reveja as configurações e escolha Finish (Concluir).

Depois de criar uma fonte de dados, você pode usá-la para create an ML model. Se você já criou um modelo, pode usar a fonte de dados para evaluate an ML model ou generate predictions.

Copiar uma fonte de dados (console)

Quando você deseja criar uma fonte de dados semelhante a uma existente, pode usar o console do Amazon ML para copiar a fonte de dados original e modificar as configurações. Por exemplo, você pode optar por iniciar com uma fonte de dados existente e, em seguida, modificar o esquema de dados para que correspondam melhor aos dados, altere a consulta SQL usada para descarregar os dados do Amazon Redshift ou especifique um usuário diferente do AWS Identity and Access Management (IAM) para acessar o cluster do Amazon Redshift.

Para copiar e modificar uma fonte de dados do Amazon Redshift
  1. Abra o console do Amazon Machine Learning em https://console.aws.amazon.com/machinelearning/.

  2. No painel do Amazon ML, em Entidades, escolha Criar novo... e depois Fonte de dados.

  3. Na página Dados de entrada, em Onde estão os dados?, escolha Amazon Redshift. Se você já tiver uma fonte de dados criada a partir dos dados do Amazon Redshift, poderá copiar as configurações de outra fonte de dados.

    Amazon S3 and Amazon Redshift icons with option to copy settings from existing datasource.

    Se ainda não tiver uma fonte de dados criada a partir dos dados do Amazon Redshift, essa opção não vai aparecer.

  4. Escolha Find a datasource (Localizar uma fonte de dados).

  5. Selecione a fonte de dados que você deseja copiar e escolha Copiar configurações. O Amazon ML preenche automaticamente a maioria das configurações de fonte de dados com as configurações da fonte de dados original. Não copie a senha do banco de dados, o local do esquema ou o nome da fonte de dados original.

  6. Modifique as configurações de preenchimento automático que você quiser alterar. Por exemplo, se você quiser alterar os dados que o Amazon ML descarrega do Amazon Redshift, altere a consulta SQL.

  7. Em Database password (Senha do banco de dados), digite a senha do banco de dados. O Amazon ML não armazena ou reutiliza a senha; portanto, você precisa fornecê-la sempre.

  8. (Opcional) Em Local do esquema, o Amazon ML pré-seleciona Quero que o Amazon ML gere um esquema recomendado para você. Se você já criou um esquema, escolha Quero usar o esquema que criei e armazenei no Amazon S3 e digite o caminho do arquivo do esquema no Amazon S3.

  9. (Opcional) Em Datasource name (Nome da fonte de dados), digite um nome para a fonte de dados. Caso contrário, o Amazon ML gera um novo nome de fonte de dados para você.

  10. Escolha Verify (Verificar). O Amazon ML verifica se ele pode se conectar ao banco de dados do Amazon Redshift.

  11. (Opcional) Se o Amazon ML inferir o esquema para você, na página Esquema, revise os tipos de dados de todos os atributos e corrija-os conforme necessário.

  12. Escolha Continue (Continuar).

  13. Se você quiser usar essa fonte de dados para criar ou avaliar um modelo de ML, em Do you plan to use this dataset to create or evaluate an ML model? (Deseja usar este conjunto de dados para criar ou avaliar um modelo de ML?), escolha Yes (Sim). Se você escolher Yes (Sim), escolha a linha de destino. Para obter mais informações sobre destinos, consulte Usar o campo targetAttributeName.

    Se você quiser usar essa fonte de dados junto com um modelo que você já criou para criar previsões, escolha No (Não).

  14. Escolha Continue (Continuar).

  15. Em Does your data contain an identifier? (Os dados contêm um identificador?), se os dados não contiverem um identificador de linha, escolha No (Não).

    Se os dados contiverem um identificador de linha, escolha Yes (Sim) e selecione a linha que você deseja usar como um identificador. Para obter informações sobre identificadores de linha, consulte Usar o campo rowID.

  16. Escolha Review (Revisar).

  17. Revise as configurações e escolha Finish (Concluir).

Depois de criar uma fonte de dados, você pode usá-la para create an ML model. Se você já criou um modelo, pode usar a fonte de dados para evaluate an ML model ou generate predictions.