테이블, 데이터베이스, 데이터 카탈로그 이해 - Amazon Athena

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

테이블, 데이터베이스, 데이터 카탈로그 이해

Athena에서 테이블과 데이터베이스는 기본 소스 데이터에 대한 스키마를 정의하는 메타데이터 정의를 위한 컨테이너입니다. 각 데이터 세트에 대한 테이블이 에 있어야 합니다.Athena. 테이블의 메타데이터는 Athena의 데이터 위치를 Amazon S3에 알려주고, 데이터의 구조(예: 열 이름, 데이터 유형 및 테이블 이름)를 지정합니다. 데이터베이스는 테이블의 논리적 그룹이며 데이터 세트에 대한 메타데이터와 스키마 정보만 보유합니다.

쿼리하려는 각 데이터 세트에 대해 쿼리 결과를 얻고 반환하는 데 사용할 기본 테이블이 Athena에 있어야 합니다. 따라서 데이터를 쿼리하기 전에 테이블이 에 등록되어 있어야 합니다.Athena. 자동 또는 수동으로 테이블을 만들면 등록이 이루어집니다.

테이블 생성 방법에 관계없이 테이블 생성 프로세스는 을(를) 통해 데이터 세트를 등록합니다.Athena. AWS Glue 데이터 카탈로그에서 등록이 이루어지며, 등록하면 Athena가 데이터에서 쿼리를 실행할 수 있게 됩니다.

  • 테이블을 자동으로 만들려면 AWS Glue에서 Athena. 크롤러를 사용하십시오. AWS Glue 및 크롤러에 대한 자세한 정보는 AWS Glue와 통합.을 참조하십시오. AWS Glue는 테이블을 생성하면 고유한 AWS Glue Data Catalog에 등록합니다. Athena는 AWS Glue Data Catalog를 사용하여 이 메타데이터를 저장하고 검색하며, 기본 데이터 세트를 분석하기 위해 쿼리를 실행할 때 사용합니다.

테이블을 생성한 후 SQL SELECT 문을 사용하여 소스 데이터에 대한 특정 파일 위치를 가져오는 등 쿼리할 수 있습니다. 쿼리 결과는 지정한 Amazon S3쿼리 결과 위치에 에 저장됩니다.

AWS 계정을 통해 AWS Glue Data Catalog 데이터 카탈로그에 액세스할 수 있습니다. 다른 AWS 서비스도 AWS Glue Data Catalog를 공유할 수 있으므로 Athena를 사용하여 조직 전체에서 생성된 데이터베이스와 테이블을 볼 수 있으며 그 반대의 경우도 마찬가지입니다. 또한 AWS Glue를 사용하면 자동으로 데이터 스키마를 찾고 데이터를 추출, 변환 및 로드(ETL)할 수 있습니다.

  • 수동으로 테이블을 생성하려면

    • Athena 콘솔을 사용하여 테이블 만들기 마법사.를 실행합니다.

    • Athena 콘솔을 사용하여 쿼리 편집기에서 Hive DDL 구문을 작성합니다.

    • Athena API 또는 CLI를 사용하여 DDL 문이 있는 SQL 쿼리 문자열을 실행합니다.

    • Athena JDBC 또는 ODBC 드라이버를 사용합니다.

테이블과 데이터베이스를 수동으로 생성하는 경우 Athena 는 후드 HiveQL 아래에서 CREATE TABLE, CREATE DATABASE및 와 같은 DROP TABLE 데이터 정의 언어(DDL) 문을 사용하여 AWS Glue 데이터 카탈로그에 테이블과 데이터베이스를 생성합니다.

참고

2017년 8월 14일 이전에 생성된 테이블이 Athena에 있는 경우, Athena 관리형 내부 데이터 카탈로그에서 생성된 것이며 업데이트할 때까지 AWS Glue 데이터 카탈로그와 나란히 존재합니다. 자세한 정보는 AWS Glue 데이터 카탈로그로 단계별 업그레이드.를 참조하십시오.

기존 테이블을 쿼리하면 Amazon Athena은(는) 기본적으로 분산 SQL 엔진인 Presto를 사용합니다. Athena에서 샘플 데이터가 포함된 예제를 보면 Athena을(를) 사용해 테이블을 생성한 다음 그에 대한 쿼리를 실행하는 방법을 알 수 있습니다. 또한 Athena은(는) Amazon S3.에 저장된 데이터를 기반으로 테이블을 생성하는 데 도움이 되는 자습서를 콘솔에 제공합니다.

  • Athena 쿼리 편집기에서 테이블을 만들고 쿼리를 작성하는 방법에 대한 단계별 자습서는 시작하기.를 참조하십시오.

  • 콘솔에서 Athena 자습서를 실행합니다. 처음으로 https://console.aws.amazon.com/athena/에 로그인하면 자동으로 시작됩니다. 콘솔에서 자습서를 선택하여 시작할 수도 있습니다.