UNLOAD

Timestream for LiveAnalytics는 SQL 지원의 확장으로 UNLOAD 명령을 지원합니다. 에서 지원하는 데이터 형식UNLOAD은에 설명되어 있습니다지원되는 데이터 유형. time 및 unknown 유형은에 적용되지 않습니다UNLOAD.


UNLOAD (SELECT statement)
 TO 's3://bucket-name/folder'
 WITH ( option = expression [, ...] )

여기서 옵션은 입니다.


{ partitioned_by = ARRAY[ col_name[,…] ] 
 | format = [ '{ CSV | PARQUET }' ] 
 | compression = [ '{ GZIP | NONE }' ]
 | encryption = [ '{ SSE_KMS | SSE_S3 }' ]
 | kms_key = '<string>'
 | field_delimiter ='<character>'
 | escaped_by = '<character>'
 | include_header = ['{true, false}']
 | max_file_size = '<value>'
}

SELECT 명령문

하나 이상의 Timestream for LiveAnalytics 테이블에서 데이터를 선택하고 검색하는 데 사용되는 쿼리 문입니다.


(SELECT column 1, column 2, column 3 from database.table
      where measure_name = "ABC" and timestamp between ago (1d) and now() )

TO 절


TO 's3://bucket-name/folder'


TO 's3://access-point-alias/folder'

UNLOAD 문의 TO 절은 쿼리 결과의 출력 대상을 지정합니다. Timestream for LiveAnalytics가 출력 파일 객체를 쓰는 Amazon S3의 폴더 위치가 있는 Amazon S3 버킷 이름 또는 Amazon S3 access-point-alias을 포함한 전체 경로를 제공해야 합니다. S3 버킷은 동일한 계정과 동일한 리전에서 소유해야 합니다. 쿼리 결과 세트 외에도 Timestream for LiveAnalytics는 매니페스트 및 메타데이터 파일을 지정된 대상 폴더에 씁니다.

PARTITIONED_BY 절


partitioned_by = ARRAY [col_name[,…] , (default: none)

partitioned_by 절은 쿼리에서 세분화된 수준에서 데이터를 그룹화하고 분석하는 데 사용됩니다. 쿼리 결과를 S3 버킷으로 내보낼 때 선택 쿼리의 하나 이상의 열을 기반으로 데이터를 분할하도록 선택할 수 있습니다. 데이터를 파티셔닝할 때 내보낸 데이터는 파티션 열을 기반으로 하위 집합으로 분할되고 각 하위 집합은 별도의 폴더에 저장됩니다. 내보낸 데이터가 포함된 결과 폴더 내에 하위 폴더folder/results/partition column = partition value/가 자동으로 생성됩니다. 그러나 분할된 열은 출력 파일에 포함되지 않습니다.

partitioned_by는 구문의 필수 절이 아닙니다. 파티셔닝 없이 데이터를 내보내도록 선택한 경우 구문에서 절을 제외할 수 있습니다.

웹 사이트의 클릭스트림 데이터를 모니터링하고 , direct, Organic Search, Social MediaOther, 라는 5개의 트래픽 채널이 있다고 가정합니다Referral. 데이터를 내보낼 때 열을 사용하여 데이터를 분할하도록 선택할 수 있습니다Channel. 데이터 폴더 에는 각각 해당 채널 이름이 있는 폴더가 5개 s3://bucketname/results있습니다. 예를 들어이 폴더s3://bucketname/results/channel=Social Media/.에서는 Social Media 채널을 통해 웹 사이트에 도착한 모든 고객의 데이터를 찾을 수 있습니다. 마찬가지로 나머지 채널에 대한 다른 폴더도 있습니다.

채널 열로 분할된 내보낸 데이터

Folder structure showing channels: Direct, Organic search, Other, Referral, and Social media.

FORMAT


format = [ '{ CSV | PARQUET }' , default: CSV

S3 버킷에 기록된 쿼리 결과의 형식을 지정하는 키워드입니다. 쉼표(,)를 기본 구분 기호로 사용하거나 분석을 위한 효율적인 개방형 열 기반 스토리지 형식인 Apache Parquet 형식으로 데이터를 쉼표로 구분된 값(CSV)으로 내보낼 수 있습니다.

압축


compression = [ '{ GZIP | NONE }' ], default: GZIP

압축 알고리즘 GZIP을 사용하여 내보낸 데이터를 압축하거나 NONE 옵션을 지정하여 압축을 해제할 수 있습니다.

암호화


encryption = [ '{ SSE_KMS | SSE_S3 }' ], default: SSE_S3

Amazon S3의 출력 파일은 선택한 암호화 옵션을 사용하여 암호화됩니다. 데이터 외에도 선택한 암호화 옵션에 따라 매니페스트 및 메타데이터 파일도 암호화됩니다. 현재 SSE_S3 및 SSE_KMS 암호화를 지원합니다. SSE_S3는 Amazon S3가 256비트 고급 암호화 표준(AES) 암호화를 사용하여 데이터를 암호화하는 서버 측 암호화입니다. SSE_KMS는 고객 관리형 키를 사용하여 데이터를 암호화하는 서버 측 암호화입니다.

KMS_KEY


kms_key = '<string>'

KMS 키는 내보낸 쿼리 결과를 암호화하는 고객 정의 키입니다. KMS 키는 AWS Key Management Service(AWS KMS)에서 안전하게 관리되며 Amazon S3의 데이터 파일을 암호화하는 데 사용됩니다.

FIELD_DELIMITER


field_delimiter ='<character>' , default: (,)

CSV 형식으로 데이터를 내보낼 때이 필드는 파이프 문자(|), 쉼표(,) 또는 탭(/t)과 같이 출력 파일의 필드를 구분하는 데 사용되는 단일 ASCII 문자를 지정합니다. CSV 파일의 기본 구분 기호는 쉼표 문자입니다. 데이터의 값에 선택한 구분 기호가 포함된 경우 구분 기호는 따옴표로 묶입니다. 예를 들어 데이터의 값에가 포함된 경우 Time,stream이 값은 내보낸 데이터에 "Time,stream" 인용됩니다. Timestream for LiveAnalytics에서 사용하는 따옴표 문자는 큰따옴표(")입니다.

CSV에 헤더를 포함하려는 FIELD_DELIMITER 경우 캐리지 리턴 문자(ASCII 13, 16진수 0D, 텍스트 '\r') 또는 줄 바꿈 문자(ASCII 10, 16진수 0A, 텍스트 '\n')를 로 지정하지 마세요. 이렇게 하면 많은 구문 분석기가 결과 CSV 출력에서 헤더를 올바르게 구문 분석할 수 없기 때문입니다.

이스케이프_바이


escaped_by = '<character>', default: (\)

CSV 형식으로 데이터를 내보낼 때이 필드는 S3 버킷에 기록된 데이터 파일에서 이스케이프 문자로 처리해야 하는 문자를 지정합니다. 이스케이핑은 다음 시나리오에서 발생합니다.

값 자체에 따옴표 문자(")가 포함된 경우 이스케이프 문자를 사용하여 이스케이프됩니다. 예를 들어 값이 이고 Time"stream(\)가 구성된 이스케이프 문자인 경우 값이 로 이스케이프됩니다Time\"stream.
값에 구성된 이스케이프 문자가 포함된 경우 이스케이프됩니다. 예를 들어 값이 인 경우 값이 로 이스케이프Time\stream됩니다Time\\stream.

참고

내보낸 출력에 배열, 행 또는 시계열과 같은의 복잡한 데이터 형식이 포함된 경우 JSON 문자열로 직렬화됩니다. 다음은 한 예입니다.

데이터 유형	실제 값	값이 CSV 형식으로 이스케이프되는 방법[직렬화된 JSON 문자열]
Array	`[ 23,24,25 ]`	`"[23,24,25]"`
열	`( x=23.0, y=hello )`	`"{\"x\":23.0,\"y\":\"hello\"}"`
시계열	`[ ( time=1970-01-01 00:00:00.000000010, value=100.0 ),( time=1970-01-01 00:00:00.000000012, value=120.0 ) ]`	`"[{\"time\":\"1970-01-01 00:00:00.000000010Z\",\"value\":100.0},{\"time\":\"1970-01-01 00:00:00.000000012Z\",\"value\":120.0}]"`

INCLUDE_HEADER


include_header = 'true' , default: 'false'

CSV 형식으로 데이터를 내보낼 때이 필드를 사용하면 내보낸 CSV 데이터 파일의 첫 번째 행으로 열 이름을 포함할 수 있습니다.

허용되는 값은 'true' 및 'false'이고 기본값은 'false'입니다. escaped_by 및와 같은 텍스트 변환 옵션은 헤더에도 field_delimiter 적용됩니다.

참고

헤더를 포함할 때는 캐리지 리턴 문자(ASCII 13, 16진수 0D, 텍스트 '\r') 또는 줄 바꿈 문자(ASCII 10, 16진수 0A, 텍스트 '\n')를 로 선택하지 않는 것이 중요합니다. 이렇게 하면 많은 구문 분석기가 결과 CSV 출력에서 헤더를 올바르게 구문 분석할 수 FIELD_DELIMITER없기 때문입니다.

MAX_FILE_SIZE


max_file_size = 'X[MB|GB]' , default: '78GB'

이 필드는 UNLOAD 문이 Amazon S3에서 생성하는 파일의 최대 크기를 지정합니다. UNLOAD 문은 여러 파일을 생성할 수 있지만 Amazon S3에 기록된 각 파일의 최대 크기는 대략이 필드에 지정된 크기입니다.

필드 값은 16MB에서 78GB 사이여야 합니다. 와 같은 정수로 지정하거나 12GB또는와 같은 소수로 지정할 수 있습니다0.5GB24.7MB. 기본값은 78GB입니다.

실제 파일 크기는 파일을 쓸 때 근사치이므로 실제 최대 크기는 지정한 수와 정확히 같지 않을 수 있습니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

설명 문

논리 연산자