Perguntas frequentes - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Perguntas frequentes

Esta seção fornece respostas às perguntas mais comuns sobre a criação de um data lake para crescimento e escala no Nuvem AWS.

Essa arquitetura de referência de data lake é mais aplicável às organizações corporativas?

A arquitetura de referência de data lake deste guia pode ser aplicada a data lakes pertencentes a organizações de qualquer tamanho. A arquitetura de referência padroniza a interface de troca de dados, reduz a sobrecarga e o custo de manutenção e expansão do data lake e pode ser aplicada a qualquer escala em que o data lake da sua organização cresça.

Ainda posso usar essa arquitetura de referência se minha organização tiver apenas um produtor de dados?

A arquitetura de referência de data lake deste guia ainda é relevante e benéfica, mesmo que sua organização tenha apenas um produtor de dados. Sem o catálogo centralizado, seu produtor de dados precisa lidar com o crescimento dos consumidores de dados, o que aumenta a complexidade e a sobrecarga. Seu data lake também é um ativo de longo prazo para sua organização e, normalmente, as organizações adicionam mais produtores de dados. Por exemplo, você pode precisar de um produtor de dados adicional para armazenar dados confidenciais por motivos de conformidade ou porque sua organização adquire outra unidade de negócios que tenha seu próprio produtor de dados.

Meu data lake conecta diretamente um produtor de dados a vários consumidores de dados. A arquitetura de referência do data lake deste guia ainda é relevante?

A arquitetura de referência do data lake beneficiaria sua organização a longo prazo. Você pode usar uma abordagem em duas etapas e começar criando o catálogo centralizado para novos consumidores de dados. Você poderia então conectar seus consumidores de dados existentes ao catálogo centralizado.

Minha organização deve seguir o fluxo de trabalho de integração e concessão de acesso sem fazer alterações nele?

Não, o objetivo principal dessa seção é ilustrar os blocos lógicos de atividades necessários durante o processo de integração. Todas as organizações devem personalizar o processo e podem até ter vários processos, dependendo da sensibilidade de seus dados.

Outra consideração é que o fluxo do processo usa a abordagem de compartilhamento baseado em recursos em. AWS Lake Formation Existem outros métodos de compartilhamento de dados suportados pelo Lake Formation, como o compartilhamento baseado em tags, em que as diferenças no processo podem ser adaptadas ao método de compartilhamento específico.