Princípios de design de data lake - Práticas recomendadas de date lake do Amazon Connect

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Princípios de design de data lake

Ao criar um data lake, é possível dissolver os silos de dados e democratizar os dados para extração de valor. Com um repositório central de dados, as organizações são capazes de tomar decisões orientadas por dados e inovar rapidamente.

As organizações buscam uma capacidade de armazenamento econômica e elástica para armazenar fontes de dados díspares que crescem exponencialmente. Elas desejam controlar e compartilhar de maneira centralizada grandes quantidades de dados em diferentes unidades de negócios. Além disso, eles querem capacitar seus funcionários e partes interessadas para obter insights de negócios com menos tempo. time-to-value

Considerações ao projetar um data lake:

  • De que forma você coleta, armazena e analisa dados de alta velocidade e de diferentes tipos, como dados estruturados, não estruturados e semiestruturados?

  • Como você armazena e compartilha petabytes de dados sob demanda de maneira econômica e globalmente?

  • Como você escala os recursos de TI para atender a um grande número de consultas simultâneas aos dados e reduz a escala verticalmente de modo automático para diminuir os custos?

  • Como os usuários visualizam, pesquisam e realizam consultas em vários repositórios de dados atualmente?

  • Como você obtém insights futuros usando padrões de dados históricos e cenários anteriores?