Amazon EMR Studio - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Amazon EMR Studio

Amazon EMR Studio est un environnement de développement intégré basé sur le Web (IDE) pour les blocs-notes Jupyter entièrement gérés qui s'exécutent sur des clusters Amazon. EMR Vous pouvez configurer un EMR studio pour que votre équipe développe, visualise et débogue des applications écrites en R, Python, Scala et. PySpark EMRStudio est intégré à AWS Identity and Access Management (IAM) et IAM Identity Center afin que les utilisateurs puissent se connecter à l'aide de leurs informations d'identification professionnelles.

Vous pouvez créer un EMR studio gratuitement. Les frais applicables au stockage Amazon S3 et aux EMR clusters Amazon s'appliquent lorsque vous utilisez EMR Studio. Pour connaître les détails et les points forts du produit, consultez la page de service d'Amazon EMR Studio.

Principales fonctionnalités de EMR Studio

Amazon EMR Studio propose les fonctionnalités suivantes :

  • Authentifiez les utilisateurs avec AWS Identity and Access Management (IAM), ou avec AWS IAM Identity Center avec ou sans propagation d'identité fiable et avec votre fournisseur d'identité d'entreprise.

  • Accédez à des EMR clusters Amazon et lancez-les à la demande pour exécuter des tâches Jupyter Notebook.

  • Connectez-vous à Amazon EMR sur des EKS clusters pour soumettre des travaux au fur et à mesure de leur exécution.

  • Exploration et enregistrement d'exemples de blocs-notes. Pour plus d'informations sur les exemples de blocs-notes, consultez le GitHub référentiel d'exemples de blocs-notes EMR Studio.

  • Analysez les données à l'aide de Python PySpark, Spark Scala, Spark R ou SparkSQL, et installez des noyaux et des bibliothèques personnalisés.

  • Collaboration en temps réel avec d'autres utilisateurs dans le même espace de travail. Pour de plus amples informations, veuillez consulter Configurer la collaboration dans Workspace dans EMR Studio.

  • Utilisez EMR Studio SQL Explorer pour parcourir votre catalogue de données, exécuter des SQL requêtes et télécharger les résultats avant de travailler avec les données d'un bloc-notes.

  • Exécution de blocs-notes paramétrés dans le cadre de flux de travail planifiés à l'aide d'un outil d'orchestration tel qu'Apache Airflow ou Amazon Managed Workflows for Apache Airflow. Pour plus d'informations, voir Orchestrer les tâches d'analyse sur les EMR ordinateurs portables à l'aide MWAA du AWS Blog sur les mégadonnées.

  • Référentiels de codes de liens tels que GitHub et. BitBucket

  • Suivez et déboguez les tâches à l'aide du serveur d'historique Spark, de l'interface utilisateur Tez ou du serveur de YARN chronologie.

EMRLe studio est HIPAA éligible et est certifié selon HITRUST CSF et SOC 2. Pour plus d'informations sur HIPAA la conformité aux AWS services, voirhttps://aws.amazon.com/compliance/hipaa-compliance/. Pour en savoir plus sur HITRUST CSF la conformité pour AWS services, voirhttps://aws.amazon.com/compliance/hitrust/.

EMRStudio est également FedRamp conforme. Pour plus d'informations sur les programmes de conformité auxquels Amazon EMR se conforme, consultez la section Validation de conformité pour Amazon EMR. Pour plus d'informations sur les programmes de conformité supplémentaires pour AWS services, voir AWS Services visés par le programme de conformité.

Historique des fonctionnalités d'Amazon EMR Studio

Ce tableau répertorie les mises à jour apportées à la fonctionnalité de dimensionnement EMR géré par Amazon.

Date de publication Capacité
5 janvier 2024

Ajout de la prise en charge de EMR Studio dans AWS GovCloud (USA Est) et AWS GovCloud (Ouest des États-Unis).

26 novembre 2023

Ajout de la prise en charge de la propagation d'identité fiable pour EMR Studio avec authentification IAM Identity Center.

26 octobre 2023

Ajout de la possibilité de créer une application EMR sans serveur dotée d'une fonctionnalité interactive.

28 février 2023

Ajouté AWS KMS support clé géré par le client pour le stockage des journaux d'applications pour les applications EMR sans serveur.

23 février 2023

Ajout de la création de IAM rôles en un clic pour la soumission de tâches EMR sans serveur. Ajout d'une fonction de ECR recherche lorsque vous sélectionnez une image personnalisée pour les applications EMR sans serveur.

27 janvier 2023

Les blocs-notes d'exécution sans tête peuvent suivre la progression de l'exécution de chaque cellule à l'aide de la commande magique %execute_notebook.

23 janvier 2023

Les applications persistantes ont été optimisées pour un lancement plus rapide.