Hudi 구성 모범 사례 - Managed Service for Apache Flink

Amazon Managed Service for Apache Flink는 이전에 Amazon Kinesis Data Analytics for Apache Flink로 알려졌습니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Hudi 구성 모범 사례

Apache Flink용 관리 서비스에서 Hudi 커넥터를 실행하려면 다음과 같이 구성을 변경하는 것이 좋습니다.

hoodie.embed.timeline.server 비활성화

Flink의 Hudi 커넥터는 작업 병렬성이 높을 때 성능을 향상시키기 위해 Flink jobmanager (JM) 에 내장된 타임라인 (TM) 서버를 설정하여 메타데이터를 캐시합니다. Apache Flink용 Managed Service for Apache Flink에서는 이 내장 서버를 사용하지 않도록 설정하는 것이 좋습니다. JM과 TM 간의 비 Flink 통신은 비활성화되기 때문입니다.

이 서버가 활성화된 경우 Hudi writes는 먼저 JM의 임베디드 서버에 연결을 시도한 다음 Amazon S3에서 메타데이터를 읽습니다. 즉, Hudi로 인해 연결 시간 초과가 발생하여 Hudi 쓰기가 지연되고 Apache Flink용 관리형 서비스의 성능이 저하됩니다.