데이터 레이크 설계 원칙 - Amazon Connect 데이터 레이크 모범 사례

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 레이크 설계 원칙

데이터 레이크를 구축하면 데이터 사일로를 허물고 가치 추출을 위해 데이터를 대중화할 수 있습니다. 중앙 데이터 리포지토리를 통해 조직은 데이터에 기반한 의사 결정을 내리고 빠르게 혁신할 수 있습니다.

조직은 기하급수적으로 증가하는 다양한 데이터 소스를 저장할 수 있는 비용 효율적이고 탄력적인 스토리지 용량을 원합니다. 이들은 여러 사업부에서 방대한 양의 데이터를 중앙에서 관리하고 공유하기를 원합니다. 또한 직원과 이해 관계자가 가치 창출 시간을 단축하면서 비즈니스 통찰력을 도출할 수 있도록 지원하고자 합니다.

데이터 레이크를 설계할 때 고려할 사항:

  • 정형, 비정형, 반정형 등 다양한 데이터 유형에서 고속 데이터를 수집, 저장, 분석하려면 어떻게 해야 할까요?

  • 페타바이트 규모의 데이터를 온디맨드 방식을 통해 전 세계적으로 비용 효율적으로 저장하고 공유하려면 어떻게 해야 할까요?

  • 데이터에 대한 대량의 동시 쿼리를 지원하도록 IT 리소스를 확장하고 비용을 절감하기 위해 자동으로 규모를 축소하려면 어떻게 해야 할까요?

  • 오늘날 사용자는 어떻게 여러 데이터 리포지토리를 보고, 검색하고, 쿼리를 실행할까요?

  • 과거 데이터 패턴과 과거 시나리오를 사용하여 미래의 인사이트를 어떻게 도출하나요?