翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データカタログを Hive メタストアに接続するための前提条件
AWS Glue Data Catalog を外部の Apache Hive メタストアに接続し、データアクセス許可を設定するには、次の要件を満たす必要があります。
注記
Lake Formation 管理者が AWS SAM アプリケーションをデプロイし、特権ユーザーのみが Hive メタストア接続を使用して対応するフェデレーティッドデータベースを作成することをお勧めします。
IAM ロールを作成します。
AWS SAM アプリケーションをデプロイするには
Hive メタストアへの接続の作成に必要なリソース (Lambda 関数、 Amazon API Gateway、IAMロール、および AWS Glue 接続) をデプロイするために必要なアクセス許可を持つロールを作成します。
フェデレーションデータベースを作成するには
リソースには次のアクセス許可が必要です。
-
glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename
-
glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection
-
Amazon S3 ロケーションを Lake Formation に登録します。
Lake Formation を使用してデータレイク内のデータを管理および保護するには、Hive メタストアのテーブルのデータを含む Amazon S3 ロケーションを Lake Formation に登録する必要があります。これにより、Lake Formation は Athena、Redshift Spectrum、Amazon などの AWS 分析サービスに認証情報を公開できますEMR。
Amazon S3 ロケーションの登録の詳細については「データレイクへの Amazon S3 ロケーションの追加」を参照してください。
Amazon S3 の場所を登録するときは、データカタログフェデレーションを有効にするチェックボックスをオンにして、Lake Formation がフェデレーティッドデータベースのテーブルにアクセスするロールを引き受けることを許可します。
データロケーションに Lake Formation を登録する方法の詳細については、「データレイク用の Amazon S3 ロケーションを設定する」を参照してください。
-
正しい Amazon EMRバージョンを使用します。
フェデレーティッド Hive メタストアデータベースEMRで Amazon を使用するには、Hive バージョン 3.x 以降と Amazon EMRバージョン 6.x 以降が必要です。