Consultation des données à l'aide de SQL Explorer - Amazon EMR

Consultation des données à l'aide de SQL Explorer

Note

SQL Explorer pour EMR Studio n'est pas compatible avec les applications interactives Amazon EMR sans serveur.

Cette rubrique fournit des informations pour vous aider à démarrer avec SQL Explorer dans Amazon EMR Studio. SQL Explorer est un outil d'une seule page intégré à votre Workspace qui vous aide à comprendre les sources de données du catalogue de données de votre cluster EMR. Vous pouvez utiliser SQL Explorer pour parcourir vos données, exécuter des requêtes SQL pour récupérer des données et télécharger les résultats des requêtes.

SQL Explorer prend en charge Presto. Avant d'utiliser SQL Explorer, assurez-vous que vous disposez d'un cluster qui utilise Amazon EMR version 5.34.0 ou ultérieure ou version 6.4.0 ou ultérieure avec Presto installé. SQL Explorer d'Amazon EMR Studio ne prend pas en charge les clusters Presto que vous avez configurés avec le chiffrement en transit. Cela est dû au fait que Presto s'exécute en mode TLS sur ces clusters.

Parcourez le catalogue de données de votre cluster

SQL Explorer fournit une interface de navigateur de catalogue que vous pouvez utiliser pour explorer et comprendre comment vos données sont organisées. Par exemple, vous pouvez utiliser le navigateur de catalogue de données pour vérifier les noms des tableaux et des colonnes avant d'écrire une requête SQL.

Parcourir votre catalogue de données
  1. Ouvrez SQL Explorer dans votre Workspace.

  2. Assurez-vous que votre Workspace est rattaché à un cluster EMR exécuté sur EC2 qui utilise Amazon EMR version 6.4.0 ou ultérieure avec Presto installé. Choisissez un cluster existant ou créez-en un. Pour de plus amples informations, veuillez consulter Attacher un calcul à un espace de travail EMR Studio.

  3. Sélectionnez une base de données dans la liste déroulante pour la parcourir.

  4. Développez un tableau dans votre base de données pour voir les noms des colonnes du tableau. Vous pouvez également saisir un mot clé dans la barre de recherche pour filtrer les résultats dans le tableau.

Exécuter une requête SQL pour récupérer des données

Récupérer des données à l'aide d'une requête SQL et télécharger les résultats
  1. Ouvrez SQL Explorer dans votre Workspace.

  2. Assurez-vous que votre Workspace est connecté à un cluster EMR exécuté sur EC2 avec Presto et Spark installés. Choisissez un cluster existant ou créez-en un. Pour de plus amples informations, veuillez consulter Attacher un calcul à un espace de travail EMR Studio.

  3. Sélectionnez Ouvrir l'éditeur pour ouvrir un nouvel onglet d'éditeur dans votre Workspace.

  4. Rédigez votre requête SQL dans l'onglet de l'éditeur.

  5. Cliquez sur Exécuter.

  6. Consultez les résultats de votre requête sous Aperçu des résultats. SQL Explorer affiche les 100 premiers résultats par défaut. Vous pouvez choisir un nombre différent de résultats à afficher (jusqu'à 1 000) à l'aide de la liste déroulante Aperçu des 100 premiers résultats de requête.

  7. Choisissez Télécharger les résultats pour télécharger vos résultats au format CSV. Vous pouvez télécharger jusqu'à 1 000 lignes de résultats.