Amazon Redshift에 shapefile 로드 - Amazon Redshift

Amazon Redshift에 shapefile 로드

COPY 명령을 사용하여 Amazon S3에 저장된 Esri shapefile을 Amazon Redshift 테이블로 수집할 수 있습니다. shapefile에는 지리학적 특성의 기하학적 위치와 속성 정보가 벡터 형식으로 저장됩니다. shapefile 형식은 점, 선 및 다각형과 같은 공간 객체를 공간적으로 설명할 수 있습니다. shapefile에 대한 자세한 내용은 Wikipedia의 Shapefile을 참조하세요.

COPY 명령은 데이터 형식 파라미터 SHAPEFILE을 지원합니다. 기본적으로 shapefile의 첫 번째 열은 GEOMETRY 또는 IDENTITY 열입니다. 모든 후속 열은 shapefile에 지정된 순서를 따릅니다. 그러나 COPY 열 매핑을 사용하여 순서를 정의할 수 있으므로 대상 테이블이 이 정확한 레이아웃에 있을 필요는 없습니다. COPY 명령 shapefile 지원에 대한 자세한 내용은 SHAPEFILE 섹션을 참조하세요.

경우에 따라 결과 지오메트리 크기가 Amazon Redshift에 지오메트리를 저장하기 위한 최댓값보다 클 수 있습니다. 이러한 경우 COPY 옵션 SIMPLIFY 또는 SIMPLIFY AUTO를 사용하여 수집하는 동안 다음과 같이 지오메트리를 단순화할 수 있습니다.

  • Ramer-Douglas-Peucker 알고리즘과 주어진 허용치를 사용하여 수집하는 동안 모든 지오메트리를 단순화하려면 SIMPLIFY tolerance를 지정합니다.

  • Ramer-Douglas-Peucker 알고리즘을 사용하여 최대 크기보다 큰 지오메트리만 단순화하려면 허용치 없이 SIMPLIFY AUTO를 지정합니다. 이 접근 방식은 최대 크기 제한 내에서 객체를 저장할 수 있을 만큼 충분히 큰 최소 허용치를 계산합니다.

  • Ramer-Douglas-Peucker 알고리즘과 자동 계산된 허용치를 사용하여 최대 크기보다 큰 지오메트리만 단순화하려면 SIMPLIFY AUTO max_tolerance를 지정합니다. 이 접근 방식은 허용치가 최대 허용치를 초과하지 않도록 합니다.

GEOMETRY 데이터 값의 최대 크기에 대한 자세한 내용은 Amazon Redshift에서 공간 데이터를 사용할 때의 고려 사항 섹션을 참조하세요.

허용치가 충분히 낮아 레코드가 GEOMETRY 데이터 값의 최대 크기 아래로 축소될 수 없는 경우도 있습니다. 이러한 경우 COPY 명령의 MAXERROR 옵션을 사용하여 수집 오류를 모두 또는 일정 수까지 무시할 수 있습니다.

또한 COPY 명령은 GZIP shapefile 로드를 지원합니다. 이를 수행하려면 COPY GZIP 파라미터를 지정합니다. 이 옵션을 사용하면 모든 shapefile 구성 요소가 독립적으로 압축되고 동일한 압축 접미사를 공유해야 합니다.

shapefile이 포함된 프로젝션 설명 파일(.prj)이 있는 경우 Redshift는 이 파일을 사용하여 SRID(공간 참조 시스템 ID)를 결정합니다. SRID가 유효하면 결과 형상에 이 SRID가 할당됩니다. 입력 형상과 연결된 SRID 값이 없으면 결과 형상의 SRID 값은 0입니다. SET read_srid_on_shapefile_ingestionOFF로 설정하여 세션 수준에서 공간 참조 시스템 ID의 자동 검색을 사용 중지할 수 있습니다.

계산된 허용치와 함께 단순화된 레코드를 보려면 SYS_SPATIAL_SIMPLIFY 또는 SVL_SPATIAL_SIMPLIFY 시스템 뷰를 쿼리합니다. SIMPLIFY tolerance를 지정하면 이 뷰에 각 COPY 작업에 대한 레코드가 포함됩니다. 그렇지 않으면 단순화된 각 지오메트리에 대한 레코드가 포함됩니다. 자세한 내용은 SYS_SPATIAL_SIMPLIFY 또는 SVL_SPATIAL_SIMPLIFY을 참조하세요.

shapefile 로드의 예는 Amazon Redshift에 shapefile 로드 섹션을 참조하세요.