AWS Data Pipeline 신규 고객은 더 이상 이용할 수 없습니다. 의 기존 고객 AWS Data Pipeline 정상적으로 서비스를 계속 사용할 수 있습니다. 자세히 알아보기
기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
EmrConfiguration
EmrConfiguration 객체는 릴리스 4.0.0 이상이 EMR 설치된 클러스터에 사용되는 구성입니다. 구성 (목록) 은 호출의 매개 변수입니다. RunJobFlow API APIAmazon의 EMR 구성에는 분류 및 속성이 사용됩니다. AWS Data Pipeline 해당 속성 객체와 EmrConfiguration 함께 사용하여 파이프라인 실행으로 시작된 EMR 클러스터에서 Hadoop, Hive, Spark 또는 Pig와 같은 EmrCluster 애플리케이션을 구성합니다. 새 클러스터의 구성만 변경할 수 있으므로 기존 리소스에 EmrConfiguration 객체를 제공할 수 없습니다. 자세한 내용은 https://docs.aws.amazon.com/ElasticMapReduce/latest/ReleaseGuide/ 단원을 참조하십시오.
예
다음 구성 객체는 core-site.xml
으로 io.file.buffer.size
및 fs.s3.block.size
속성을 설정합니다.
[
{
"classification":"core-site",
"properties":
{
"io.file.buffer.size": "4096",
"fs.s3.block.size": "67108864"
}
}
]
해당 파이프라인 개체 정의는 property
필드에 있는 EmrConfiguration 개체와 속성 개체 목록을 사용합니다.
{
"objects": [
{
"name": "ReleaseLabelCluster",
"releaseLabel": "emr-4.1.0",
"applications": ["spark", "hive", "pig"],
"id": "ResourceId_I1mCc",
"type": "EmrCluster",
"configuration": {
"ref": "coresite"
}
},
{
"name": "coresite",
"id": "coresite",
"type": "EmrConfiguration",
"classification": "core-site",
"property": [{
"ref": "io-file-buffer-size"
},
{
"ref": "fs-s3-block-size"
}
]
},
{
"name": "io-file-buffer-size",
"id": "io-file-buffer-size",
"type": "Property",
"key": "io.file.buffer.size",
"value": "4096"
},
{
"name": "fs-s3-block-size",
"id": "fs-s3-block-size",
"type": "Property",
"key": "fs.s3.block.size",
"value": "67108864"
}
]
}
다음 예제는 hadoop-env
분류를 사용하여 Hadoop 환경을 설정하도록 사용된 중첩 구성입니다.
[
{
"classification": "hadoop-env",
"properties": {},
"configurations": [
{
"classification": "export",
"properties": {
"YARN_PROXYSERVER_HEAPSIZE": "2396"
}
}
]
}
]
다음은 이 구성을 사용하는 해당 파이프라인 정의 객체입니다.
{
"objects": [
{
"name": "ReleaseLabelCluster",
"releaseLabel": "emr-4.0.0",
"applications": ["spark", "hive", "pig"],
"id": "ResourceId_I1mCc",
"type": "EmrCluster",
"configuration": {
"ref": "hadoop-env"
}
},
{
"name": "hadoop-env",
"id": "hadoop-env",
"type": "EmrConfiguration",
"classification": "hadoop-env",
"configuration": {
"ref": "export"
}
},
{
"name": "export",
"id": "export",
"type": "EmrConfiguration",
"classification": "export",
"property": {
"ref": "yarn-proxyserver-heapsize"
}
},
{
"name": "yarn-proxyserver-heapsize",
"id": "yarn-proxyserver-heapsize",
"type": "Property",
"key": "YARN_PROXYSERVER_HEAPSIZE",
"value": "2396"
},
]
}
다음 예제는 클러스터의 Hive 관련 속성을 수정합니다. EMR
{
"objects": [
{
"name": "hivesite",
"id": "hivesite",
"type": "EmrConfiguration",
"classification": "hive-site",
"property": [
{
"ref": "hive-client-timeout"
}
]
},
{
"name": "hive-client-timeout",
"id": "hive-client-timeout",
"type": "Property",
"key": "hive.metastore.client.socket.timeout",
"value": "2400s"
}
]
}
구문
이 객체에는 다음 필드가 포함됩니다.
필수 필드 | 설명 | 슬롯 유형 |
---|---|---|
분류 | 구성에 대한 분류입니다. | String |
선택 필드 | 설명 | 슬롯 유형 |
---|---|---|
구성 | 이 구성의 하위 구성입니다. | 참조 객체, 예: “구성”: {"ref”:” Id "} myEmrConfiguration |
parent | 슬롯을 상속할 현재 객체의 부모입니다. | 참조 객체, 예: “부모”: {"ref”:” myBaseObject Id "} |
property | 구성 속성입니다. | 참조 객체, 예: “속성”: {"ref”:” myPropertyId “} |
실행 시간 필드 | 설명 | 슬롯 유형 |
---|---|---|
@version | 객체와 함께 생성된 파이프라인 버전입니다. | String |
시스템 필드 | 설명 | 슬롯 유형 |
---|---|---|
@오류 | 잘못 형성된 객체를 설명하는 오류 | String |
@pipelineId | 이 객체가 속하는 파이프라인의 ID | String |
@sphere | 객체의 타원 무늬는 수명 주기 내 위치를 나타냅니다. Component Objects는 Attempt Objects를 실행하는 Instance Objects를 야기합니다. | String |