AWS Serverless Application Repository을 사용하여 데이터 원본 커넥터 배포 - Amazon Athena

AWS Serverless Application Repository을 사용하여 데이터 원본 커넥터 배포

데이터 원본 커넥터를 배포하기 위해 Athena 콘솔로 시작하는 대신 AWS Serverless Application Repository를 사용할 수 있습니다. AWS Serverless Application Repository로 사용할 커넥터를 찾고 커넥터에 필요한 파라미터를 제공한 다음 계정에 커넥터를 배포합니다. 그런 다음 커넥터를 배포한 후 Athena 콘솔을 사용하여 Athena에서 데이터 원본을 사용할 수 있도록 합니다.

계정에 커넥터 배포

AWS Serverless Application Repository을 사용하여 데이터 원본 커넥터를 계정에 배포하려면
  1. AWS Management Console에 로그인하고 서버리스 앱 리포지토리를 엽니다.

  2. 탐색 창에서 사용 가능한 애플리케이션을 선택합니다.

  3. 사용자 지정 IAM 역할 또는 리소스 정책을 만드는 앱 표시(Show apps that create custom IAM roles or resource policies) 옵션을 선택합니다.

  4. 검색 상자에 커넥터 이름을 입력합니다. 사전 구축된 Athena 데이터 커넥터의 목록은 사용 가능한 데이터 소스 커넥터 단원을 참조하세요.

  5. 커넥터의 이름을 선택합니다. 커넥터를 선택하면 AWS Lambda 콘솔에서 Lambda 함수의 애플리케이션 세부 정보(Application details) 페이지가 열립니다.

  6. 세부 정보 페이지 오른쪽의 애플리케이션 설정(Application settings)에서 필수 정보를 입력합니다. 최소 필수 설정은 다음과 같습니다. Athena에서 구축한 데이터 커넥터의 나머지 구성 가능한 옵션에 대한 자세한 내용은 GitHub의 사용 가능한 커넥터 주제를 참조하세요.

    • AthenaCatalogNamecloudwatchlogs와 같이 대상으로 하는 데이터 원본을 나타내는 소문자로 된 Lambda 함수의 이름입니다.

    • SpillBucket – Lambda 함수 응답 크기 제한을 초과하는 대규모 응답 페이로드에서 데이터를 수신하도록 계정에 Amazon S3 버킷을 지정합니다.

  7. 이 앱이 사용자 지정 IAM 역할 및 리소스 정책을 생성하는 것을 확인(I acknowledge that this app creates custom IAM roles and resource policies)을 선택합니다. 자세한 내용을 보려면 정보 링크를 선택하세요.

  8. 애플리케이션 설정(Application settings) 섹션의 오른쪽 하단에서 배포(Deploy)를 선택합니다. 배포가 완료되면 Lambda 콘솔의 리소스 섹션에 Lambda 함수가 나타납니다.

Athena에서 커넥터 사용 설정

<shared id="ATE"/> 콘솔을 사용하여 <shared id="ATE"/>에서 데이터 원본을 사용할 수 있도록 합니다.

<shared id="ATE"/> 콘솔을 사용하여 <shared id="ATE"/>에서 데이터 원본을 사용할 수 있도록 합니다.
  1. https://console.aws.amazon.com/athena/에서 Athena 콘솔을 엽니다.

  2. 콘솔 탐색 창이 표시되지 않으면 왼쪽의 확장 메뉴를 선택합니다.

    확장 메뉴를 선택합니다.
  3. 탐색 창에서 데이터 원본(Data sources)을 선택합니다.

  4. 데이터 원본(Data sources) 페이지에서 데이터 원본 생성(Create data source)을 선택합니다.

  5. 데이터 원본 선택에서는 AWS Serverless Application Repository에서 커넥터를 생성한 데이터 원본을 선택합니다. 이 자습서에서는 Amazon CloudWatch Logs를 연합 데이터 원본으로 선택합니다.

  6. 다음을 선택합니다.

  7. 데이터 원본 세부 정보 입력(Enter data source details) 섹션의 데이터 원본 이름(Data source name)에 <shared id="ATE"/>에서 데이터 원본을 쿼리할 때 SQL 문에 사용할 이름을 입력합니다(예: CloudWatchLogs). 이름은 127자까지 입력할 수 있으며 계정 내에서 고유해야 합니다. 생성 후에는 변경할 수 없습니다. 유효한 문자는 a-z, A-Z, 0-9, _(밑줄), @(앰퍼샌드) 및 -(하이픈)입니다. awsdatacatalog, hive, jmx, system 이름은 Athena에 예약되어 있으므로 데이터 원본 이름에 사용할 수 없습니다.

  8. 연결 세부 정보 섹션에서, Lambda 함수 선택 또는 입력 상자를 사용해 방금 만든 함수의 이름을 선택합니다. Lambda 함수의 ARN이 표시됩니다.

  9. (선택 사항) 태그(Tags)에 대해 이 데이터 원본과 연결할 키-값 페어를 추가합니다. 태그에 대한 자세한 내용은 Athena 리소스 태깅 단원을 참조하세요.

  10. 다음을 선택합니다.

  11. 검토 및 생성 페이지에서 데이터 원본 세부 정보를 검토한 다음 데이터 원본 생성을 선택합니다.

  12. 데이터 원본 세부 정보(Data source details) 페이지 섹션에는 새 커넥터에 대한 정보가 표시됩니다. 이제 <shared id="ATE"/> 쿼리에 커넥터를 사용할 수 있습니다.

    쿼리에서 데이터 커넥터 사용에 대한 자세한 내용은 페더레이션된 쿼리 실행 섹션을 참조하세요.