배치 로드에 대한 데이터 모델 매핑 - Amazon Timestream

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

배치 로드에 대한 데이터 모델 매핑

다음은 데이터 모델 매핑 스키마와 의 및 예제를 설명합니다.

데이터 모델 매핑 스키마

CreateBatchLoadTask 요청 구문과 배치 로드DataModel용 를 포함하는 BatchLoadTaskDescription 객체를 DescribeBatchLoadTask 포함하도록 호출로 반환되는 DataModelConfiguration 객체입니다. 는 S3 위치에 CSV 형식으로 저장된 소스 데이터에서 LiveAnalytics 데이터베이스 및 테이블의 대상 Timestream으로의 매핑을 DataModel 정의합니다.

TimeColumn 필드는 에 대한 Timestream의 대상 테이블 time 열에 매핑될 값에 대한 소스 데이터의 위치를 나타냅니다 LiveAnalytics. 는 의 단위를 TimeUnit 지정하며 TimeColumn, MILLISECONDS, SECONDS MICROSECONDS또는 중 하나가 될 수 있습니다NANOSECONDS. 차원 및 측정값에 대한 매핑도 있습니다. 차원 매핑은 소스 열과 대상 필드로 구성됩니다.

자세한 내용은 DimensionMapping를 참조하세요. 측정값에 대한 매핑에는 MixedMeasureMappings 및 두 가지 옵션이 있습니다MultiMeasureMappings.

요약하자면 에는 S3 위치의 데이터 소스에서 다음에 대한 LiveAnalytics 테이블에 대한 대상 Timestream으로의 매핑이 DataModel 포함되어 있습니다.

  • Time

  • 차원

  • 치수

가능하면 에 대한 Timestream의 다중 측정 레코드에 측정 데이터를 매핑하는 것이 좋습니다 LiveAnalytics. 다중 측정 레코드의 이점에 대한 자세한 내용은 섹션을 참조하세요다중 측정 레코드.

소스 데이터의 여러 측정값이 한 행에 저장되는 경우 해당 여러 측정값을 를 LiveAnalytics 사용하기 위해 Timestream의 다중 측정 레코드에 매핑할 수 있습니다MultiMeasureMappings. 단일 측정 레코드에 매핑해야 하는 값이 있는 경우 를 사용할 수 있습니다MixedMeasureMappings.

MixedMeasureMappings 및 둘 MultiMeasureMappings 다 를 포함합니다MultiMeasureAttributeMappings. 단일 측정 레코드가 필요한지 여부에 관계없이 다중 측정 레코드가 지원됩니다.

의 Timestream에는 다중 측정 대상 레코드만 필요한 경우 다음 구조에서 측정 매핑을 정의할 LiveAnalytics수 있습니다.

CreateBatchLoadTask
    MeasureNameColumn
    MultiMeasureMappings
        TargetMultiMeasureName
        MultiMeasureAttributeMappings array
참고

가능하면 MultiMeasureMappings 를 사용하는 것이 좋습니다.

의 Timestream에 단일 측정 대상 레코드가 필요한 경우 다음 구조에서 측정 매핑을 정의할 LiveAnalytics수 있습니다.

CreateBatchLoadTask
    MeasureNameColumn
    MixedMeasureMappings array
        MixedMeasureMapping
            MeasureName
            MeasureValueType
            SourceColumn
            TargetMeasureName
            MultiMeasureAttributeMappings array

MultiMeasureMappings를 사용하는 경우 항상 MultiMeasureAttributeMappings 배열이 필요합니다. MixedMeasureMappings 배열을 사용할 때 MeasureValueType가 지정된 에 MULTI 대한 경우 MixedMeasureMappingMultiMeasureAttributeMappings는 해당 에 필요합니다MixedMeasureMapping. 그렇지 않으면 는 단일 측정 레코드의 측정 유형을 MeasureValueType 나타냅니다.

어느 쪽이든 사용 MultiMeasureAttributeMapping 가능한 배열이 있습니다. 다음과 MultiMeasureAttributeMapping 같이 각 에서 다중 측정 레코드에 대한 매핑을 정의합니다.

SourceColumn

Amazon S3에 있는 소스 데이터의 열입니다.

TargetMultiMeasureAttributeName

대상 테이블에서 대상 다중 측정 이름의 이름입니다. 이 입력은 MeasureNameColumn 이 제공되지 않은 경우 필요합니다. MeasureNameColumn 이 제공되면 해당 열의 값이 다중 측정 이름으로 사용됩니다.

MeasureValueType

DOUBLE, BIGINT BOOLEANVARCHAR, 또는 중 하나TIMESTAMP.

MultiMeasureMappings 예제를 사용한 데이터 모델 매핑

이 예제에서는 각 측정값을 전용 열에 저장하는 선호하는 접근 방식인 다중 측정 레코드에 대한 매핑을 보여줍니다. 샘플 CSV에서 샘플을 다운로드할 수 있습니다. CSV 샘플에는 LiveAnalytics 테이블에 대한 Timestream의 대상 열에 매핑할 수 있는 다음 제목이 있습니다.

  • time

  • measure_name

  • region

  • location

  • hostname

  • memory_utilization

  • cpu_utilization

CSV 파일에서 timemeasure_name 열을 식별합니다. 이 경우 이러한 맵은 동일한 이름의 LiveAnalytics 테이블 열에 대해 Timestream에 직접 매핑됩니다.

  • time 에 매핑 time

  • measure_name measure_name (또는 선택한 값)에 매핑

를 사용할 때 TimeColumn 필드에 time를 지정하고 필드와 같은 지원되는 시간 단위 값을 API지정합니다MILLISECONDSTimeUnit. 이는 콘솔의 소스 열 이름타임스탬프 시간 입력에 해당합니다. MeasureNameColumn 키로 정의된 measure_name를 사용하여 레코드를 그룹화하거나 파티션할 수 있습니다.

샘플에서 , locationregionhostname는 차원입니다. 차원은 DimensionMapping 객체 배열로 매핑됩니다.

측정값의 경우 값은 LiveAnalytics 테이블의 Timestream에서 열이 TargetMultiMeasureAttributeName 됩니다. 이 예제와 같은 이름을 유지할 수 있습니다. 또는 새 를 지정할 수 있습니다. MeasureValueTypeDOUBLE, BIGINT, BOOLEAN, VARCHAR또는 중 하나입니다TIMESTAMP.

{ "TimeColumn": "time", "TimeUnit": "MILLISECONDS", "DimensionMappings": [ { "SourceColumn": "region", "DestinationColumn": "region" }, { "SourceColumn": "location", "DestinationColumn": "location" }, { "SourceColumn": "hostname", "DestinationColumn": "hostname" } ], "MeasureNameColumn": "measure_name", "MultiMeasureMappings": { "MultiMeasureAttributeMappings": [ { "SourceColumn": "memory_utilization", "TargetMultiMeasureAttributeName": "memory_utilization", "MeasureValueType": "DOUBLE" }, { "SourceColumn": "cpu_utilization", "TargetMultiMeasureAttributeName": "cpu_utilization", "MeasureValueType": "DOUBLE" } ] } }
Visual builder interface showing column mappings for timestream data attributes and types.

MixedMeasureMappings 예제를 사용한 데이터 모델 매핑

Timestream for 에서 단일 측정 레코드에 매핑해야 하는 경우에만 이 접근 방식을 사용하는 것이 좋습니다 LiveAnalytics.