As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Início rápido do Amazon DataZone com dados do Amazon Redshift
Conclua as etapas a seguir de início rápido para executar os fluxos de trabalho completos do produtor e do consumidor de dados no Amazon DataZone com exemplos de dados do Amazon Redshift.
Etapas do Início rápido
- Etapa 1: criar o domínio e o portal de dados do Amazon DataZone
- Etapa 2: criar o projeto de publicação
- Etapa 3: criar o ambiente
- Etapa 4: produzir dados para publicação
- Etapa 5: coletar metadados do Amazon Redshift
- Etapa 6: organizar e publicar o ativo de dados
- Etapa 7: criar o projeto para análise de dados
- Etapa 8: criar um ambiente para análise de dados
- Etapa 9: pesquisar o catálogo de dados e assinar os dados
- Etapa 10: aprovar solicitação de assinatura
- Etapa 11: criar uma consulta e analisar os dados no Amazon Redshift
Etapa 1: criar o domínio e o portal de dados do Amazon DataZone
Conclua o procedimento a seguir para criar um domínio do Amazon DataZone. Para obter mais informações sobre domínios do Amazon DataZone, consulte Terminologia e conceitos do Amazon DataZone.
-
Navegue até o console do Amazon DataZone em https://console.aws.amazon.com/datazone
, faça login e escolha Criar domínio. nota
Se você quiser usar um domínio existente do Amazon DataZone para esse fluxo de trabalho, escolha Visualizar domínios, escolha o domínio que deseja usar e prossiga para a Etapa 2 da criação de um projeto de publicação.
-
Na página Criar domínio, forneça valores para os seguintes campos:
-
Nome: especifique um nome para seu domínio. Para fins desse fluxo de trabalho, você pode chamar esse domínio de
Marketing
. -
Descrição: especifique uma descrição de domínio opcional.
-
Criptografia de dados: seus dados são criptografados por padrão com uma chave que a AWS possui e gerencia para você. Para este passo a passo, você pode deixar as configurações padrão de criptografia de dados.
Para obter mais informações sobre chaves gerenciadas pelo cliente, consulte Criptografia de dados em repouso para a Amazon DataZone. Se você usa sua própria chave do KMS para criptografia de dados, deverá incluir a declaração a seguir no AmazonDataZoneDomainExecutionRole padrão.
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "kms:Decrypt", "kms:GenerateDataKey" ], "Resource": "*" } ] }
-
Acesso ao serviço: escolha a opção Usar um perfil de serviço personalizado e, em seguida, escolha AmazonDataZoneDomainExecutionRole no menu suspenso.
-
Em Configuração rápida, escolha Configurar esta conta para consumo e publicação de dados. Essa opção habilita os esquemas integrados do Amazon DataZone do Data Lake e do Data Warehouse e configura as permissões e os recursos necessários para concluir o restante das etapas desse fluxo de trabalho. Para obter mais informações sobre esquemas do Amazon DataZone, consulte Terminologia e conceitos do Amazon DataZone.
-
Mantenha os campos restantes em Detalhes de permissões e Tags inalterados e escolha Criar domínio.
-
-
Depois que o domínio for criado com sucesso, escolha esse domínio e, na página de resumo do domínio, anote o URL do portal de dados desse domínio. Você pode usar essa URL para acessar seu portal de dados Amazon DataZone a fim de concluir o restante das etapas desse fluxo de trabalho.
nota
Na versão atual do Amazon DataZone, depois que o domínio é criado, a URL gerada para o portal de dados não pode ser modificada.
A criação do domínio pode levar alguns minutos para ser concluída. Aguarde até que o domínio tenha um status Disponível antes de prosseguir para a próxima etapa.
Etapa 2: criar o projeto de publicação
A seção a seguir descreve as etapas da criação do projeto de publicação nesse fluxo de trabalho.
-
Depois de concluir a Etapa 1, navegue até o portal de dados do Amazon DataZone usando a URL do portal de dados e faça login usando suas credenciais de autenticação única (SSO) ou do AWS IAM.
-
Escolha Criar projeto, especifique o nome do projeto, por exemplo, para esse fluxo de trabalho, você pode chamá-lo de SalesDataPublishingProject, deixe os outros campos inalterados e escolha Criar.
Etapa 3: criar o ambiente
A seção a seguir descreve as etapas da criação de um ambiente nesse fluxo de trabalho.
-
Depois de concluir a Etapa 2, no portal de dados do Amazon DataZone, escolha o projeto
SalesDataPublishingProject
que você criou na etapa anterior, escolha a guia Ambientes e escolha Criar ambiente. -
Na página Criar ambiente, especifique os itens a seguir e escolha Criar ambiente.
-
Nome: especifique o nome do ambiente. Esta apresentação você pode chamar de
Default data warehouse environment
. -
Descrição: especifique uma descrição para o ambiente.
-
Perfil do ambiente: escolha o perfil do ambiente DataWarehouseProfile.
-
Forneça o nome do seu cluster do Amazon Redshift, o nome do banco de dados e o ARN secreto para o cluster do Amazon Redshift em que seus dados estão armazenados.
nota
Certifique-se de que seu segredo no AWS Secrets Manager tenha as seguintes tags (chave/valor):
-
Para o cluster do Amazon Redshift - datazone.rs.cluster: <cluster_name:database name>
Para o grupo de trabalho Amazon Redshift sem servidor - datazone.rs.workgroup: <workgroup_name:database_name>
-
AmazonDataZoneProject: <projectID>
-
AmazonDataZoneDomain: <domainID>
Para obter mais informações, consulte Armazenamento de credenciais de banco de dados no AWS Secrets Manager.
O usuário do banco de dados que você fornece no AWS Secrets Manager deve ter permissões de superusuário.
-
-
Etapa 4: produzir dados para publicação
A seção a seguir descreve as etapas da produção de dados para publicação nesse fluxo de trabalho.
-
Depois de concluir a Etapa 3, no portal de dados Amazon DataZone, escolha o projeto
SalesDataPublishingProject
e, no painel direito, em Ferramentas de analytics, escolha Amazon Redshift. Isso abre o Editor de Consultas do Amazon Redshift usando as credenciais do seu projeto para autenticação. -
Para este passo a passo, você está usando o script de consulta Cria tabela como seleção (CTAS) para criar uma nova tabela que você deseja publicar no Amazon DataZone. No seu editor de consultas, execute esse script CTAS para criar uma tabela
mkt_sls_table
que você possa publicar e disponibilizar para pesquisa e assinatura.CREATE TABLE mkt_sls_table AS SELECT 146776932 AS ord_num, 23 AS sales_qty_sld, 23.4 AS wholesale_cost, 45.0 as lst_pr, 43.0 as sell_pr, 2.0 as disnt, 12 as ship_mode,13 as warehouse_id, 23 as item_id, 34 as ctlg_page, 232 as ship_cust_id, 4556 as bill_cust_id UNION ALL SELECT 46776931, 24, 24.4, 46, 44, 1, 14, 15, 24, 35, 222, 4551 UNION ALL SELECT 46777394, 42, 43.4, 60, 50, 10, 30, 20, 27, 43, 241, 4565 UNION ALL SELECT 46777831, 33, 40.4, 51, 46, 15, 16, 26, 33, 40, 234, 4563 UNION ALL SELECT 46779160, 29, 26.4, 50, 61, 8, 31, 15, 36, 40, 242, 4562 UNION ALL SELECT 46778595, 43, 28.4, 49, 47, 7, 28, 22, 27, 43, 224, 4555 UNION ALL SELECT 46779482, 34, 33.4, 64, 44, 10, 17, 27, 43, 52, 222, 4556 UNION ALL SELECT 46779650, 39, 37.4, 51, 62, 13, 31, 25, 31, 52, 224, 4551 UNION ALL SELECT 46780524, 33, 40.4, 60, 53, 18, 32, 31, 31, 39, 232, 4563 UNION ALL SELECT 46780634, 39, 35.4, 46, 44, 16, 33, 19, 31, 52, 242, 4557 UNION ALL SELECT 46781887, 24, 30.4, 54, 62, 13, 18, 29, 24, 52, 223, 4561
Certifique-se de que a tabela mkt_sls_table tenha sido criada com sucesso. Agora você tem um ativo de dados que pode ser publicado no catálogo do Amazon DataZone.
Etapa 5: coletar metadados do Amazon Redshift
A seção a seguir descreve as etapas da coleta de metadados do Amazon Redshift.
-
Depois de concluir a Etapa 4, no portal de dados do Amazon DataZone, escolha o projeto
SalesDataPublishingProject
, escolha a guia Dados e, em seguida, escolha Fontes de dados. -
Escolha a fonte que foi criada como parte do processo de criação do ambiente.
-
Escolha Executar ao lado do menu suspenso Ação e, em seguida, escolha o botão Atualizar. Quando a execução da fonte de dados é concluída, os ativos são adicionados ao inventário do Amazon DataZone.
Etapa 6: organizar e publicar o ativo de dados
A seção a seguir descreve as etapas da curadoria e publicação do ativo de dados nesse fluxo de trabalho.
-
Depois de concluir a etapa 5, no portal de dados Amazon DataZone, escolha o projeto
SalesDataPublishingProject
, escolha a guia Dados, escolha Dados de inventário e localize a tabelamkt_sls_table
. -
Abra a página de detalhes do ativo
mkt_sls_table
para ver os nomes comerciais gerados automaticamente. Escolha o ícone Metadados gerados automaticamente para visualizar os nomes gerados automaticamente para ativos e colunas. Você pode aceitar ou rejeitar cada nome individualmente ou escolher Aceitar tudo para aplicar os nomes gerados. Opcionalmente, você também pode adicionar o formulário de metadados disponível ao seu ativo e selecionar termos do glossário para classificar seus dados. -
Choose Publicar para publicar o ativo
mkt_sls_table
.
Etapa 7: criar o projeto para análise de dados
A seção a seguir descreve as etapas da criação do projeto para análise de dados nesse fluxo de trabalho.
-
Depois de concluir a Etapa 6, no portal de dados Amazon DataZone, escolha Criar projeto.
-
Na página Criar projeto, especifique o nome do projeto, por exemplo, para esse fluxo de trabalho, você pode chamá-lo de MarketingDataAnalysisProject, deixar o restante dos campos inalterados e escolher Criar.
Etapa 8: criar um ambiente para análise de dados
A seção a seguir descreve as etapas da criação de um ambiente para análise de dados nesse fluxo de trabalho.
-
Depois de concluir a Etapa 7, no portal de dados Amazon DataZone, escolha o projeto
MarketingDataAnalysisProject
que você criou na etapa anterior, escolha a guia Ambientes e escolha Adicionar ambiente. -
Na página Criar ambiente, especifique os itens a seguir e escolha Criar ambiente.
-
Nome: especifique o nome do ambiente. Esta apresentação você pode chamar de
Default data warehouse environment
. -
Descrição: especifique uma descrição para o ambiente.
-
Perfil de ambiente: escolha o perfil de ambiente DataWarehouseProfile.
-
Forneça o nome do seu cluster do Amazon Redshift, o nome do banco de dados e o ARN secreto para o cluster do Amazon Redshift em que seus dados estão armazenados.
nota
Certifique-se de que seu segredo no AWS Secrets Manager tenha as seguintes tags (chave/valor):
-
Para o cluster do Amazon Redshift - datazone.rs.cluster: <cluster_name:database name>
Para o grupo de trabalho Amazon Redshift sem servidor - datazone.rs.workgroup: <workgroup_name:database_name>
-
AmazonDataZoneProject: <projectID>
-
AmazonDataZoneDomain: <domainID>
Para obter mais informações, consulte Armazenamento de credenciais de banco de dados no AWS Secrets Manager.
O usuário do banco de dados que você fornece no AWS Secrets Manager deve ter permissões de superusuário.
-
-
Para esta apresentação, mantenha os demais campos inalterados.
-
Etapa 9: pesquisar o catálogo de dados e assinar os dados
A seção a seguir descreve as etapas da pesquisa no catálogo de dados e na assinatura dos dados.
-
Depois de concluir a Etapa 8, no portal de dados do Amazon DataZone, pesquise ativos de dados usando palavras-chave (por exemplo, 'catálogo' ou 'vendas') na barra de pesquisa do portal de dados.
Se necessário, aplique filtros ou classificação e, depois de localizar o ativo de dados de vendas do produto, você poderá escolhê-lo para abrir a página de detalhes do ativo.
-
Na página de detalhes do ativo de Dados de vendas de produtos, escolha Inscrever-se.
-
Na caixa de diálogo, escolha seu projeto de consumidor no menu suspenso, forneça o motivo da solicitação de acesso e escolha Inscrever-se.
Etapa 10: aprovar solicitação de assinatura
A seção a seguir descreve as etapas para aprovar a solicitação de assinatura nesse fluxo de trabalho.
-
Depois de concluir a Etapa 9, no portal de dados Amazon DataZone, escolha o projeto SalesDataPublishingProject com o qual você publicou seu ativo.
-
Escolha a guia Dados, depois Dados publicados e, em seguida, Solicitações recebidas.
-
Escolha o link de exibição da solicitação e, em seguida, escolha Aprovar.
Etapa 11: criar uma consulta e analisar os dados no Amazon Redshift
Agora que você publicou com sucesso um ativo no catálogo do Amazon DataZone e se inscreveu nele, você pode analisá-lo.
-
No portal de dados do Amazon DataZone, no painel direito, clique no link Amazon Redshift. Será aberto o editor de consultas do Amazon Redshift usando a credencial do projeto para autenticação.
-
Agora você pode executar uma consulta (instrução de seleção) na tabela assinada. Você pode clicar na tabela (opção de três pontos verticais) e escolher a visualização para que a instrução de seleção apareça na tela do editor. Execute a consulta para ver os resultados.