MSK Connect 이해 - Amazon Managed Streaming for Apache Kafka

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

MSK Connect 이해

MSK Connect는 개발자가 Apache Kafka 클러스터에서 데이터를 쉽게 스트리밍할 수 MSK 있는 Amazon의 기능입니다. MSK Connect는 Apache Kafka 클러스터를 데이터베이스, 검색 인덱스 및 파일 시스템과 같은 외부 시스템과 연결하기 위한 오픈 소스 프레임워크인 Kafka Connect 2.7.1을 사용합니다. MSK Connect를 사용하면 데이터를 Amazon S3 및 Amazon OpenSearch Service와 같은 인기 있는 데이터 스토어로 이동하거나 데이터에서 가져오는 Kafka Connect용으로 구축된 완전 관리형 커넥터를 배포할 수 있습니다. 데이터베이스의 변경 로그를 Apache Kafka 클러스터로 스트리밍하기 위해 Debezium과 같은 타사 개발 커넥터를 배포하거나 코드 변경 없이 기존 커넥터를 배포할 수 있습니다. 커넥터는 부하 변화에 따라 자동으로 규모를 조정하며 사용한 리소스에 대해서만 비용을 지불합니다.

소스 커넥터를 사용하여 외부 시스템에서 주제로 데이터를 가져올 수 있습니다. 싱크 커넥터를 사용하면 주제의 데이터를 외부 시스템으로 내보낼 수 있습니다.

MSK Connect는 MSK 클러스터든 독립적으로 호스팅되는 Apache Kafka 클러스터VPC든 관계없이 Amazon 에 연결된 모든 Apache Kafka 클러스터에 대한 커넥터를 지원합니다.

MSK Connect는 커넥터 상태 및 전송 상태를 지속적으로 모니터링하고, 기본 하드웨어를 패치 및 관리하고, 처리량의 변화에 맞게 커넥터를 자동 조정합니다.

MSK Connect 사용을 시작하려면 섹션을 참조하세요MSK Connect 시작하기.

MSK Connect를 사용하여 생성할 수 있는 AWS 리소스에 대한 자세한 내용은 커넥터 이해, 사용자 지정 플러그인 생성및 섹션을 참조하세요MSK Connect 작업자 이해.

MSK 연결 에 대한 자세한 API내용은 Amazon MSK Connect API 참조 를 참조하세요.

Amazon MSK Connect 사용의 이점

Apache Kafka는 실시간 데이터 스트림을 수집 및 처리하기 위해 가장 널리 사용되는 오픈 소스 스트리밍 플랫폼 중 하나입니다. Apache Kafka를 사용하면 데이터 생성 및 데이터 소비 애플리케이션을 분리하여 독립적으로 확장할 수 있습니다.

Kafka Connect는 Apache Kafka를 사용하여 스트리밍 애플리케이션을 구축하고 실행하는 데 중요한 구성 요소입니다. Kafka Connect는 Kafka와 외부 시스템 간에 데이터를 이동하는 표준화된 방법을 제공합니다. Kafka Connect는 확장성이 뛰어나며 대량의 데이터를 처리할 수 있습니다. Kafka Connect는 Kafka 주제와 외부 시스템 간에 데이터를 이동하는 커넥터를 구성, 배포 및 모니터링하기 위한 강력한 API 작업 및 도구 세트를 제공합니다. 이러한 도구를 사용하여 Kafka Connect의 기능을 사용자 지정하고 확장하여 스트리밍 애플리케이션의 특정 요구 사항을 충족할 수 있습니다.

Apache Kafka Connect 클러스터를 단독으로 운영하거나 오픈 소스 Apache Kafka Connect 애플리케이션을 로 마이그레이션하려고 할 때 문제가 발생할 수 있습니다 AWS. 이러한 문제에는 인프라를 설정하고 애플리케이션을 배포하는 데 필요한 시간, 자체 관리형 Apache Kafka Connect 클러스터를 설정할 때 발생하는 엔지니어링 장애물, 관리 운영 오버헤드가 포함됩니다.

이러한 문제를 해결하려면 Amazon Managed Streaming for Apache Kafka Connect(Amazon MSK Connect)를 사용하여 오픈 소스 Apache Kafka Connect 애플리케이션을 로 마이그레이션하는 것이 좋습니다 AWS. Amazon MSK Connect는 Kafka Connect를 사용하여 Apache Kafka 클러스터와 데이터베이스, 검색 인덱스 및 파일 시스템과 같은 외부 시스템 간에 데이터를 스트리밍하는 것을 간소화합니다.

다음은 Amazon MSK Connect로 마이그레이션할 때 얻을 수 있는 몇 가지 이점입니다.

  • 운영 오버헤드 제거 — Amazon MSK Connect는 Apache Kafka Connect 클러스터의 패치 적용, 프로비저닝 및 확장과 관련된 운영 부담을 덜어줍니다. Amazon MSK Connect는 Connect 클러스터의 상태를 지속적으로 모니터링하고 워크로드에 지장을 주지 않고 패치 및 버전 업그레이드를 자동화합니다.

  • Connect 작업 자동 재시작 - Amazon MSK Connect는 실패한 작업을 자동으로 복구하여 프로덕션 중단을 줄일 수 있습니다. 작업 실패는 Kafka에 대한 TCP 연결 제한 위반, 새 작업자가 싱크 커넥터에 대한 소비자 그룹에 가입할 때 작업 재조정과 같은 일시적인 오류로 인해 발생할 수 있습니다.

  • 자동 수평 및 수직 조정 - Amazon MSK Connect를 사용하면 커넥터 애플리케이션이 더 높은 처리량을 지원하도록 자동으로 확장할 수 있습니다. Amazon MSK Connect는 확장을 관리합니다. Auto Scaling 그룹의 작업자 수와 사용률 임계값만 지정하면 됩니다. Amazon MSK Connect UpdateConnector API 작업을 사용하여 변수 처리량을 지원하기 위해 1~8 vCPUs 사이의 를 수직으로 확장하거나 축소 vCPUs 할 수 있습니다.

  • 프라이빗 네트워크 연결 - Amazon MSK Connect는 AWS PrivateLink 및 프라이빗 DNS 이름을 사용하여 소스 및 싱크 시스템에 비공개로 연결합니다.