Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Configuration des connecteurs pour Trino
Connexion à AWS Glue en tant que métastore Hive
Il est important et utile de comprendre que vous pouvez configurer AWS Glue Data Catalog comme métastore Hive lorsque vous exécutez des requêtes avec Trino. Pour plus d'informations, y compris les étapes de configuration d'un cluster avec un métastore Hive, voir Utilisation du catalogue de données AWS Glue comme métastore pour Hive.
Pour plus d'informations sur l'intégration d'EMR sur EKS avec AWS Glue, consultez les meilleures pratiques suivantes, Intégration des conteneurs EMR
Connexion aux tables Iceberg lors de l'utilisation de Trino avec Amazon EMR
Iceberg est un format de table ouvert pour les tables analytiques. Il a été créé pour des moteurs tels que Spark et Trino afin d'interroger des données volumineuses à partir des mêmes tables, à l'aide de requêtes SQL. Il inclut des fonctionnalités telles que l'isolation des lectures et des écritures de données, afin qu'un lecteur puisse éviter d'interroger des données partiellement mises à jour, par exemple. Il prend également en charge les fonctionnalités d'état, telles que les instantanés. Il fournit une couche d'abstraction grâce à l'utilisation de métadonnées et de fichiers manifestes. Ils décrivent le schéma des tables et facilitent les requêtes de données sans avoir à connaître beaucoup de détails sur leur mise en forme ou leur organisation. Lorsque vous êtes connecté, vous pouvez à la fois lire les données des tables, les mettre à jour ou écrire de nouvelles données dans les fichiers sous-jacents.
Un atelier vous montre comment configurer les tables Iceberg avec Amazon EMR et AWS Glue. Pour plus d'informations, consultez Analytics Workshop - Configurer et utiliser les tables Apache Iceberg sur votre lac de données
Établir des liens avec les clients
Vous pouvez vous connecter à Trino à l'aide d'un pilote JDBC disponible. Pour plus d'informations, consultez le pilote JDBC
Surveillance
Vous pouvez surveiller les clusters Amazon EMR via le. AWS Management Console Pour plus d'informations, consultez Afficher et surveiller un cluster Amazon EMR pendant qu'il exécute des tâches. Amazon EMR envoie également ses mesures de surveillance à. Amazon CloudWatch Pour plus d'informations sur la surveillance d'un cluster Amazon EMR, consultez les Amazon CloudWatch événements et les métriques d'Amazon EMR.