Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation AWS Lake Formation avec Amazon Redshift Spectrum
Amazon Redshift Spectrum vous permet d'interroger et de récupérer des données dans les lacs de données Amazon S3 sans charger de données dans les nœuds du cluster Amazon Redshift.
Redshift Spectrum propose deux méthodes pour enregistrer un catalogue de AWS Glue données externe activé avec Lake Formation.
Utilisation d'un IAM rôle attaché à un cluster autorisé à accéder au catalogue de données
Pour créer un IAM rôle, suivez les étapes décrites dans la procédure ci-dessous.
-
Utilisation d'une IAM identité fédérée configurée pour gérer l'accès aux ressources externes AWS Glue Data Catalog
Redshift Spectrum permet d'interroger les tables de Lake Formation à l'aide d'identités fédérées. IAM Les IAM identités peuvent être un IAM utilisateur ou un IAM rôle. Pour plus d'informations sur la fédération IAM d'identité dans Redshift Spectrum, consultez Utilisation d'une identité fédérée pour gérer l'accès d'Amazon Redshift aux ressources locales et aux tables externes Redshift Spectrum.
Grâce à l'intégration de Lake Formation à Redshift Spectrum, vous pouvez définir des autorisations de contrôle d'accès au niveau des lignes, des colonnes et des cellules sur les tables une fois vos données enregistrées auprès de Lake Formation.
Pour plus d'informations, consultez la section Utilisation de Redshift Spectrum avec. AWS Lake Formation
Redshift Spectrum prend en charge les lectures ou les SELECT
requêtes sur les tables de schéma externes gérées par Lake Formation.
Pour plus d'informations, consultez Création de schémas externes pour Redshift Spectrum.
Support pour les types de tables transactionnels
Ce tableau répertorie les formats de tables transactionnels pris en charge dans Redshift Spectrum et les autorisations Lake Formation applicables.
Formats de tableau pris en charge | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Format de table | Description et opérations autorisées | Autorisations de Lake Formation prises en charge dans Redshift Spectrum | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Apache Hudi |
Format utilisé pour simplifier le traitement incrémentiel des données et le développement de pipelines de données. Redshift Spectrum prend en charge les opérations d'écriture d'insertion, de suppression et d'insertion à l'aide du format de table Apache Hudi Copy on Write (CoW) Pour plus d'informations, voir Création de tables externes pour les données gérées dans Apache Hudi. |
Filtrage des données et sécurité au niveau des cellules dans Lake FormationÀ utiliser pour sécuriser les tables Hudi à l'aide d'autorisations au niveau des tables, des colonnes, des lignes et des cellules. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Apache Iceberg |
Format de tableau ouvert qui gère de grandes collections de fichiers sous forme de tableaux et prend en charge les opérations de lac de données analytiques modernes, telles que les requêtes d'insertion, de mise à jour, de suppression et de voyage dans le temps au niveau des enregistrements. Pour plus d'informations, consultez la section Utilisation des tables Apache Iceberg avec Amazon Redshift. |
Redshift Spectrum prend en charge les tables Apache Iceberg pour les requêtes. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Linux Foundation Delta Lake | Delta Lake est un projet open source qui permet de mettre en œuvre des architectures de lacs de données modernes généralement basées sur Amazon S3 ou Hadoop Distributed File System (). HDFS Redshift Spectrum prend en charge l'interrogation des tables Delta Lake. Pour plus d'informations, voir Création de tables externes pour les données gérées dans Delta Lake. |
Les autorisations au niveau des tables, des colonnes, des lignes et des cellules sont prises en charge. |