FAQ - AWS 규범적 지침

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

FAQ

이 섹션에서는AWS 클라우드의 데이터 레이크 계층에 대한 S3 버킷 및 경로 이름을 정의하는 것과 관련하여 자주 제기되는 질문에 대한 답변을 제공합니다.

다중 지역 Amazon Simple Simple Simple Simple Simple Simple Simple Storage Service (Amazon S3) Simple Simple Storage Service

권장되는 S3 버킷 명명 형식을 사용하고AWS 리전 식별자를 변경할 수 있습니다. 예: examplecompany-raw-useast1-12345-dev, examplecoompany-raw-uswest1-12345-dev.

데이터 레이크 레이어의 이름으로 원시, 스테이지, 분석을 사용해야 하나요?

아니요, 사용자의 요구 사항에 따라 레이어의 이름을 지정할 수 있습니다. 하지만 원본 파일 형식을 포함하고 버전 관리가 활성화된 데이터 계층에는 S3 버킷을 사용하는 것이 좋습니다.

S3 버킷의 이름을 바꿀 수 있습니까?

아니요. 다른 S3 버킷 이름을 사용하려면 새 이름으로 새 버킷을 만들어야 합니다. S3 버킷에 대해 명확하고 일관된 이름 지정 방식을 사용하는 것이 권장되는 이유 중 하나입니다.

S3 버킷을 삭제하고 이름을 다시 사용하려는 경우 어떻게 됩니까?

S3 버킷을 삭제하고 동일한 이름으로 새 버킷을 생성하려는 경우 이름을 다시 사용할 수 있을 때까지 몇 분 정도 기다려야 합니다. S3 버킷 이름은 전역적으로 고유하며 모두 동일한 네임스페이스를AWS 계정 공유합니다.

S3 버킷 또는 경로 이름에 포함할 수 있는 항목에 제한이 있습니까?

S3 버킷 이름에는 소문자, 숫자, 대시 및 점만 허용됩니다. 버킷 이름은 길이가 3~63자여야 하고 숫자 또는 문자로 시작하고 끝나야 하며 IP 주소 형식일 수 없습니다. 이름도 전역적으로 고유해야 합니다.

S3 버킷 경로에는 대문자를 사용할 수 있지만 소문자만 사용하는 것이 좋습니다. 경로에는 추가 기호도 포함될 수 있지만 밑줄, 대시, 슬래시 및 숫자만 사용하는 것이 좋습니다.

내 데이터 레이크에서 landing zone, 로우, 스테이지, 분석 레이어보다 더 많은 레이어를 사용할 수 있나요?

예. 원하는 만큼 레이어를 사용할 수 있습니다. 하지만 원시 데이터에는 landing zone 영역과 원시 레이어, 형식이 지정된 데이터에는 중간 레이어, 고도로 모델링된 데이터에는 레이어를 사용하는 것이 좋습니다.

파라미터를 정의하지 않은 경우 어떻게 되나요?

특정 파라미터 (예: 사업부) 는 S3 버킷 이름에 통합할 필요는 없지만 경로의 일부일 수 있습니다. 즉, S3 버킷을 생성한 후에 경로를 추가할 수 있으므로 경로를 즉시 결정할 필요가 없습니다.

사업부 수준에서 비용을 추적하려면 어떻게 해야 합니까?

이는 계정 전략에 따라 달라집니다. 사업부를 여러AWS 계정 사업부로 분할한 경우 각 사업부의 버킷 비용을 반영하는 비용 할당 태그를 S3 버킷에 할당할 수 있습니다.

계정 전략이 사업부를 서로AWS 계정 구분하지 않는 경우 버킷 이름에 사업부를 추가하여 각 사업부마다 서로 다른 버킷을 사용할 수 있습니다 (예:exampleco-businessunit1-raw-useast1-12345-dev). 하지만 이는 많은 S3 버킷을 관리해야 한다는 것을 의미합니다.

S3 버킷 네이밍 표준을 만들 때 고려해야 할 기능은 무엇입니까?

S3 버킷 이름이 버킷 수준에서만 사용할 수 있는 기능을 사용하는지 확인해야 합니다. 예를 들어 비용 태그, 버킷 암호화 및 버전 관리는 전체 S3 버킷에서만 사용할 수 있는 기능입니다. 즉, S3 버킷의 모든 객체나 경로에 적용됩니다.

객체 버전 관리도 고려해야 할 중요한 기능입니다. 원시 레이어의 S3 버킷에 대한 버전 관리를 켜야 합니다. 데이터에 변경 사항이 있는 경우 이전 버전을 볼 수 있도록 해야 하기 때문입니다. 그러나 데이터 레이크의 모든 계층에 대해 버전 관리가 필요하지 않을 수 있으며 여러 버전을 유지하면 불필요한 비용이 발생할 수 있습니다.