기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
FAQ
이 섹션에서는에서 성장 및 확장을 위해 데이터 레이크를 설계하는 방법에 대해 일반적으로 제기되는 질문에 대한 답변을 제공합니다 AWS 클라우드.
이 데이터 레이크 참조 아키텍처는 엔터프라이즈 조직에 더 적합합니까?
이 가이드의 데이터 레이크 참조 아키텍처는 모든 규모의 조직에 속한 데이터 레이크에 적용할 수 있습니다. 참조 아키텍처는 데이터 교환 인터페이스를 표준화하고, 데이터 레이크를 유지 및 확장하는 데 드는 오버헤드와 비용을 낮추며, 조직의 데이터 레이크가 확장되는 모든 규모에 적용할 수 있습니다.
조직에 데이터 생산자가 하나뿐인 경우에도이 참조 아키텍처를 사용할 수 있나요?
이 가이드의 데이터 레이크 참조 아키텍처는 조직에 데이터 생산자가 하나뿐인 경우에도 여전히 관련이 있고 유용합니다. 중앙 집중식 카탈로그가 없으면 데이터 생산자가 데이터 소비자의 증가를 처리해야 하므로 복잡성과 오버헤드가 증가합니다. 데이터 레이크는 조직의 장기 자산이기도 하며 일반적으로 조직은 데이터 생산자를 더 추가합니다. 예를 들어 규정 준수 이유 또는 조직에서 자체 데이터 생산자가 있는 다른 사업부를 인수하기 때문에 민감한 데이터를 저장하려면 추가 데이터 생산자가 필요할 수 있습니다.
데이터 레이크는 한 데이터 생산자를 여러 데이터 소비자와 직접 연결합니다. 이 가이드의 데이터 레이크 참조 아키텍처는 여전히 관련이 있나요?
데이터 레이크 참조 아키텍처는 장기적으로 조직에 도움이 됩니다. 2단계 접근 방식을 사용하여 새로운 데이터 소비자를 위한 중앙 집중식 카탈로그를 구축하여 시작할 수 있습니다. 그런 다음 기존 데이터 소비자를 중앙 집중식 카탈로그에 연결할 수 있습니다.
조직이 온보딩 및 액세스 권한 부여 워크플로를 변경하지 않고 따라야 합니까?
아니요,이 섹션의 주요 목적은 온보딩 프로세스 중에 필요한 논리적 활동 블록을 설명하는 것입니다. 모든 조직은 프로세스를 사용자 지정해야 하며 데이터의 민감도에 따라 여러 프로세스가 있을 수도 있습니다.
또 다른 고려 사항은 프로세스 흐름이의 리소스 기반 공유 접근 방식을 사용한다는 것입니다 AWS Lake Formation. 태그 기반 공유와 같이 Lake Formation에서 지원하는 다른 데이터 공유 메서드가 있으며, 여기서 프로세스의 차이를 특정 공유 메서드에 맞게 조정할 수 있습니다.