Historique de la documentation pour AWS Glue

Modification	Description	Date
Support pour les nouveaux types de travailleurs G.12X, G.16X et les types de travailleurs R optimisés pour la mémoire	Ajout de la prise en charge des nouveaux types de travailleurs G.12X, G.16X et des types de travailleurs R.1X, R.2X, R.4X, R.8X optimisés pour la mémoire pour les tâches. AWS Glue Ces nouveaux types de travailleurs fournissent des options de calcul et de mémoire supplémentaires pour répondre aux différentes exigences de charge de travail. Pour plus d'informations, consultez la section Ajout de tâches AWS Glue.	30 janvier 2025
Support pour 14 nouveaux connecteurs natifs SaaS supplémentaires pour AWS Glue	Quatorze connecteurs natifs SaaS supplémentaires ont été ajoutés AWS Glue. Pour plus d'informations, consultez la section Ajout d'une AWS Glue connexion.	30 janvier 2025
Support pour 16 nouveaux connecteurs natifs SaaS supplémentaires pour AWS Glue	Seize connecteurs natifs SaaS supplémentaires ont été ajoutés AWS Glue. Pour plus d'informations, consultez la section Ajout d'une AWS Glue connexion.	17 décembre 2024
Génération automatique de statistiques sur les colonnes	AWS Glue Data Quality prend désormais en charge Amazon SageMaker AI LakeHouse les tables et les tables Iceberg, Delta et HUDI AWS Lake Formation gérées dans Data Catalog et ETL. Pour plus d'informations, consultez la section QualitéAWS Glue des données.	6 décembre 2024
Support pour les intégrations sans ETL	Zero-ETL est un ensemble d'intégrations entièrement gérées AWS qui minimise le besoin de créer des pipelines de données ETL. Pour plus d'informations, consultez la section Intégrations Zero-ETL.	3 décembre 2024
Support pour les connexions réutilisables	Un nouveau schéma de AWS Glue connexions fournit un moyen unifié de gérer les connexions de données entre les AWS services et les applications AWS Glue, tels qu'Amazon Athena et Amazon SageMaker Unified Studio. Pour plus d'informations, consultez la section Connexion aux données.	3 décembre 2024
Support pour AWS Glue la version 5.0.	Ajout d'informations sur le support de AWS Glue la version 5.0. Les fonctionnalités incluent une mise à jour d'Apache Spark vers la version 3.52, une mise à jour de Java vers la version 17, des mises à jour du format de table ouvert, un contrôle d'accès précis natif de Spark, l'intégration de Sagemaker Lakehouse et de l'abstraction de l'entrepôt de données, le support dans Sagemaker Unified Studio, etc. Pour plus d'informations, consultez les notes AWS Glue de publication et la migration des AWS Glue tâches vers la AWS Glue version 5.0.	3 décembre 2024
Connexion à l' AWS Glue Data Catalog aide du point de AWS Glue terminaison Iceberg REST	AWS Glue le point de terminaison Iceberg REST prend en charge les opérations d'API spécifiées dans la spécification REST d'Apache Iceberg. À l'aide d'un client REST Iceberg, vous pouvez connecter votre application exécutée sur un moteur d'analyse au catalogue REST hébergé dans le catalogue de données. Pour plus d'informations, consultez la section Accès au catalogue de données.	3 décembre 2024
Génération automatique de statistiques sur les colonnes	Générez automatiquement des statistiques de colonne pour les nouvelles tables du AWS Glue Data Catalog. Pour plus d'informations, consultez la section Génération automatique de statistiques de colonnes.	3 décembre 2024
Support pour les mises à niveau de l'IA générative pour Apache Spark dans AWS Glue	Spark Upgrades in AWS Glue permet aux ingénieurs de données et aux développeurs de mettre à niveau et de migrer, de mettre à niveau et de migrer leurs tâches AWS Glue Spark existantes vers les dernières versions de Spark à l'aide de l'IA générative. Pour plus d'informations, consultez la section Analyse des mises à niveau avec l'IA.	22 novembre 2024
Support pour la résolution des problèmes liés à l'IA générative pour Apache Spark dans AWS Glue	La résolution des problèmes liés à l'IA générative pour les tâches Apache Spark AWS Glue permet aux ingénieurs de données et aux scientifiques de diagnostiquer et de résoudre facilement les problèmes liés à leurs applications Spark. Pour plus d'informations, consultez la section Résolution des problèmes liés aux tâches Spark avec l'IA.	22 novembre 2024
Support pour les optimiseurs Iceberg pour accéder aux compartiments Amazon S3 dans un VPC	AWS Glue Data Catalog prend en charge les optimiseurs de table Iceberg pour accéder aux compartiments Amazon S3 depuis un Virtual Private Cloud ( AWS Glue VPC) spécifique via une connexion réseau. Pour plus d’informations, consultez Optimisation des tables Iceberg.	20 novembre 2024
Support pour neuf nouveaux connecteurs natifs SaaS supplémentaires pour AWS Glue	Neuf autres connecteurs natifs SaaS ont été ajoutés AWS Glue. Pour plus d'informations, consultez la section Ajout d'une AWS Glue connexion.	19 novembre 2024
Support de dix nouveaux connecteurs natifs SaaS pour AWS Glue	Dix connecteurs natifs SaaS ont été ajoutés AWS Glue. Pour plus d'informations, consultez la section Ajout d'une AWS Glue connexion.	15 novembre 2024
Support pour la mise en file d'attente pour AWS Glue les tâches ETL	Vous pouvez activer la mise en file d'attente pour exécuter des tâches ultérieurement, lorsqu'elles ne peuvent pas être exécutées immédiatement en raison de quotas de service. Pour plus d'informations, consultez la section Configuration des propriétés des tâches Spark dans AWS Glue.	3 septembre 2024
Changements de politique mis à jour	Modifications documentées des AwsGlueSessionUserRestrictedNotebookServiceRolepolitiques AwsGlueSessionUserRestrictedNotebookPolicyet, nécessaires à la prise en charge tag-on-create des sessions avec clé de balise propriétaire. Pour plus d'informations, voir les AWS Glue mises à jour des politiques AWS gérées.	30 août 2024
La détection des anomalies et les règles dynamiques sont désormais disponibles pour tous	AWS Glue Data Quality utilise un algorithme d'apprentissage automatique pour tirer des leçons des tendances passées, puis prévoir les valeurs futures afin de détecter les anomalies. Les règles dynamiques vous permettent de fournir des seuils dynamiques. Pour plus d'informations, consultez Optimisation des performances des requêtes pour les tables Iceberg.	7 août 2024
Changements de politique mis à jour	Modifications documentées des AwsGlueSessionUserRestrictedServiceRolepolitiques AwsGlueSessionUserRestrictedPolicyet, nécessaires à la prise en charge tag-on-create des sessions avec clé de balise propriétaire. Pour plus d'informations, voir les AWS Glue mises à jour des politiques AWS gérées.	5 août 2024
La génération de statistiques de colonnes pour les tables Iceberg est désormais généralement disponible	AWS Glue prend en charge le calcul et la mise à jour du nombre de valeurs distinctes (NDVs) pour chaque colonne des tables Iceberg. Pour plus d'informations, consultez la section Détection des anomalies dans la section Qualité AWS Glue des données et Règles dynamiques.	9 juillet 2024
Support pour les profils AWS Glue d'utilisation	Les administrateurs peuvent créer des profils AWS Glue d'utilisation pour différentes catégories d'utilisateurs au sein du compte, telles que les développeurs, les testeurs et les équipes produit. Cette flexibilité permet aux administrateurs d'appliquer différents contrôles d'utilisation et de coûts pour chaque catégorie d'utilisateurs. Pour plus d'informations, consultez la section Configuration des profils AWS Glue d'utilisation.	18 juin 2024
Support pour un connecteur Salesforce AWS Glue pour Spark	Ajout d'informations sur un nouveau AWS Glue connecteur pour Salesforce. Cette fonctionnalité vous permet d'utiliser Spark AWS Glue pour lire et écrire dans Salesforce dans les versions AWS Glue 4.0 et ultérieures. Pour plus d'informations, consultez la section Connexion à Salesforce.	22 mai 2024
Intégration des données Amazon Q dans AWS Glue (GA)	L'intégration de données dans Amazon Q AWS Glue est une nouvelle fonctionnalité d'IA générative AWS Glue qui permet aux ingénieurs de données et aux développeurs ETL de créer des tâches d'intégration de données en langage naturel. Les ingénieurs et les développeurs peuvent demander à Q de créer des tâches, de résoudre des problèmes et de répondre à des questions concernant AWS Glue l'intégration des données. Pour plus d’informations, consultez la rubrique Intégration des données Amazon Q dans AWS Glue. Cette fonctionnalité inclut une mise à jour des politiques `AwsGlueSessionUserRestrictedPolicyAwsGlueSessionUserRestrictedNotebookServiceRole`, et `AwsGlueSessionUserRestrictedServiceRole` AWS gérées. Pour plus d'informations, voir les AWS Glue mises à jour des politiques AWS gérées.	30 avril 2024
Intégration des données Amazon Q dans AWS Glue (version préliminaire)	L'intégration de données dans Amazon Q AWS Glue est une nouvelle fonctionnalité d'IA générative AWS Glue qui permet aux ingénieurs de données et aux développeurs ETL de créer des tâches d'intégration de données en langage naturel. Les ingénieurs et les développeurs peuvent demander à Q de créer des tâches, de résoudre des problèmes et de répondre à des questions concernant AWS Glue l'intégration des données. Pour plus d’informations, consultez la rubrique Intégration des données Amazon Q dans AWS Glue. Cette fonctionnalité inclut une mise à jour de la politique `AwsGlueSessionUserRestrictedNotebookPolicy` AWS gérée. Pour plus d'informations, voir les AWS Glue mises à jour des politiques AWS gérées.	30 janvier 2024
Mise à jour de la documentation pour le AWS Glue streaming	Ajout d'un nouveau chapitre avec du contenu nouveau et réorganisé pour le AWS Glue streaming. Ce contenu décrit le fonctionnement du streaming AWS Glue, les caractéristiques du traitement des données en temps réel et la manière de surveiller vos tâches de streaming. Pour plus d’informations, veuillez consulter AWS Glue Streaming.	27 décembre 2023
Prise en charge de la détection détaillée des données sensibles	La transformation Détecter les données sensibles permet de détecter, masquer ou supprimer des entités que vous définissez ou sont prédéfinies par AWS Glue. Les actions détaillées vous permettent en outre d'appliquer une action spécifique par entité. Pour plus d’informations, consultez la rubrique Utilisation d’une détection détaillée des données sensibles.	26 novembre 2023
Support pour le suivi des tâches à l'aide de métriques AWS Glue d'observabilité	Utilisez les métriques AWS Glue d'observabilité pour obtenir des informations sur ce qui se passe dans vos tâches AWS Glue pour Apache Spark afin d'améliorer le triage et l'analyse des problèmes. Pour plus d'informations, consultez la section Surveillance à l'aide de métriques AWS Glue d'observabilité.	26 novembre 2023
Support pour la détection des anomalies dans le domaine de la qualité AWS Glue des données	AWS Glue La détection des anomalies de qualité des données applique des algorithmes d'apprentissage automatique (ML) aux statistiques des données au fil du temps afin de détecter les modèles anormaux et les problèmes cachés de qualité des données difficiles à détecter par le biais de règles. Pour plus d'informations, consultez la section Détection des anomalies dans AWS Glue Data Quality.	26 novembre 2023
Mise à jour du comportement par défaut de journalisation de l’interface utilisateur Spark	Les tâches Spark générant des journaux de l'interface utilisateur Spark seront désormais écrites avec un modèle de nom de fichier différent pour prendre en charge l'interface utilisateur Spark dans la AWS Glue console. Cela ne modifie pas le comportement du CloudWatch journal. Vous pouvez revenir à l’ancien comportement en mettant à jour la configuration de votre tâche. Pour plus d’informations, consultez la rubrique Surveillance des tâches à l’aide de l’interface web d’Apache Spark.	17 novembre 2023
Support pour les nouvelles sources de données dans AWS Glue Spark	Les connexions à Amazon OpenSearch Service, Azure SQL, Azure Cosmos pour NoSQL, SAP HANA, Teradata Vantage et Vertica sont désormais prises en charge de manière native au sein de ce service. AWS Glue En outre, les connexions à ces sources de données, ainsi qu'à MongoDB, peuvent désormais être utilisées dans l'éditeur visuel de AWS Glue Studio. Pour plus d'informations, consultez Types et options de connexion pour ETL dans Spark AWS Glue pour plus d'informations sur AWS Glue le support de Spark et Ajout d'une AWS Glue connexion pour des informations sur l'utilisation dans l'éditeur visuel AWS Glue Studio.	17 novembre 2023
Prise en charge de la génération de statistiques de colonne	Vous pouvez calculer des statistiques au niveau des colonnes pour AWS Glue Data Catalog des tables dans des formats de données tels que Parquet, ORC, JSON, ION, CSV et XML sans configurer de pipelines de données supplémentaires. Pour plus d’informations, consultez Utilisation des statistiques de colonne.	16 novembre 2023
Prise en charge du compactage des données des tables Iceberg	Pour améliorer les performances de lecture des services AWS d'analyse tels qu'Amazon Athena et Amazon EMR, ainsi que pour les tâches AWS Glue ETL, Data Catalog propose un compactage géré (un processus qui compacte de petits objets Amazon S3 en objets plus grands) pour les tables Iceberg dans Data Catalog. Pour plus d’informations, consultez Optimisation des tables Iceberg.	13 novembre 2023
Mise à jour du comportement d'attente lors de l'exécution des tâches	Les exécutions de tâches standard du shell Spark et Python seront désormais transférées vers `WAITING` dans certaines situations, au lieu de passer immédiatement à `FAILED`. Pour plus d’informations, consultez la rubrique États d’exécution des tâches AWS Glue.	8 novembre 2023
AWS Glue Studio guide de l'utilisateur consolidé dans le guide AWS Glue du développeur	Le guide de AWS Glue Studio l'utilisateur a été transféré dans le guide du développeur afin de créer un guide utilisateur unifié unique pour AWS Glue Studio la AWS Glue console et l'accès AWS Glue Studio par programmation.	25 octobre 2023
Mise à jour de la politique AWSGlue ServiceNotebookRole AWS gérée	Ajout d'informations concernant une mise à jour mineure de la politique AWSGlue ServiceNotebookRole AWS gérée. Pour plus d'informations, voir AWS Glue Mises à jour des politiques AWS gérées.	9 octobre 2023
AWS Glue Studio prend en charge cinq nouvelles transformations intégrées	AWS Glue Studio prend en charge les cinq nouvelles transformations intégrées suivantes : correspondance des enregistrements, suppression des lignes nulles, analyse de la colonne JSON, extraction du chemin JSON et extracteur Regex. Pour plus d'informations, consultez la section Modification des nœuds de transformation de données AWS Glue gérés.	11 août 2023
Mise à jour de la politique AWSGlue ServiceRole AWS gérée	Ajout d'informations concernant une mise à jour mineure de la politique AWSGlue ServiceRole AWS gérée. Pour plus d'informations, voir AWS Glue Mises à jour des politiques AWS gérées.	4 août 2023
Prise en charge pour l'indexation de tables Apache Hudi	Ajout d'informations sur l'utilisation AWS Glue pour explorer les tables Hudi dans les compartiments Amazon S3 et sur l'enregistrement des tables Hudi dans le. AWS Glue Data Catalog Pour plus d'informations, consultez Which data stores can I crawl?, et Crawler properties.	21 juillet 2023
Mise à jour de la politique AWSGlue ConsoleFullAccess AWS gérée	Ajout d'informations concernant une mise à jour mineure de la politique AWSGlue ConsoleFullAccess AWS gérée. Pour plus d'informations, voir AWS Glue Mises à jour des politiques AWS gérées.	14 juillet 2023
Prise en charge pour l'indexation de tables Apache Iceberg	Ajout d'informations sur l'utilisation AWS Glue pour explorer les tables Iceberg dans les compartiments Amazon S3 et sur l'enregistrement des tables Iceberg dans le. AWS Glue Data Catalog Pour plus d'informations, consultez Which data stores can I crawl?, et Crawler properties.	7 juillet 2023
Support pour AWS Glue with Ray	Ajout d'informations sur AWS Glue with Ray, un nouveau moteur qui permet de sauvegarder AWS Glue des jobs. Réorganisé l'existant AWS Glue avec du contenu Spark pour lever toute ambiguïté.	30 mai 2023
Support pour la qualité AWS Glue des données (GA)	AWS Glue La qualité des données est désormais généralement disponible. AWS Glue La qualité des données vous aide à évaluer et à contrôler la qualité de vos données. Pour plus d'informations sur l'utilisation de la qualité AWS Glue des données avec le catalogue de données, consultez la section QualitéAWS Glue des données. Pour en savoir plus sur la qualité AWS Glue des données pour AWS Glue Studio, consultez la section Évaluation de la qualité des données avec AWS Glue Studio.	24 mai 2023
Prise en charge de types de travailleurs plus importants pour les tâches Apache Spark	La prise en charge est désormais disponible pour l'utilisation des types de travailleurs `G.4X` et `G.8X` pour les tâches Apache Spark. Ces types de travailleurs sont appropriés pour les tâches dont les charges de travail contiennent les transformations, les agrégations, les jointures et les requêtes les plus exigeantes. Pour plus d'informations, consultez la section Ajout de tâches AWS Glue.	8 mai 2023
Prise en charge de la création d'index de partition lors de l'indexation de tables	Ajout d'informations sur la manière dont les Crawlers prennent en charge la création d'index de partition pour les tables détectées par le Crawler. Pour plus d'informations, consultez Setting the partition index crawler configuration option.	24 avril 2023
Prise en charge des mesures d'utilisation des ressources	Ajout d'informations sur l'affichage de l'utilisation des ressources du service et la configuration des alarmes dans Amazon CloudWatch. Pour plus d'informations, consulter AWS Glue resource monitoring.	7 avril 2023
Mise à jour de la politique AWSGlue ConsoleFullAccess AWS gérée	Ajout d'informations concernant une mise à jour mineure de la politique AWSGlue ConsoleFullAccess AWS gérée. Pour plus d'informations, voir AWS Glue Mises à jour des politiques AWS gérées.	28 mars 2023
Ajout de conseils d'utilisation AWS Glue avec un AWS SDK avec des exemples	Le guide du AWS Glue développeur comporte deux nouvelles sections qui fournissent des informations pour vous aider AWS Glue à utiliser un AWS SDK. Pour plus d'informations, consultez les sections Utilisation AWS Glue avec un AWS SDK et Exemples de code d' AWS Glue utilisation AWS SDKs.	23 février 2023
Mise à jour de la documentation pour IAM avec AWS Glue	Informations réorganisées et ajoutées sur l'utilisation d'IAM avec. AWS Glue Pour plus d'informations, veuillez consulter la rubrique Gestion des identités et des accès pour AWS Glue.	15 février 2023
Support pour l'exécution de tâches ETL en streaming dans AWS Glue la version 4.0	Ajout d'informations concernant la prise en charge de l'exécution de tâches ETL en streaming dans Glue version 4.0, et de nouvelles options de connexion à un cluster Kafka ou à un cluster Amazon Managed Streaming for Apache Kafka et Amazon Kinesis Data Streams. Pour plus d'informations, veuillez consulter les rubriques Ajout de tâches ETL en streaming dans AWS Glue et Types et options de connexion pour ETL dans AWS Glue.	8 février 2023
Prise en charge de l'analyse des sources de données MongoDB Atlas	Ajout d'informations sur l'utilisation AWS Glue pour explorer les sources de données MongoDB Atlas. Pour plus d'informations, voir Quels magasins de données puis-je explorer ? , propriétés de connexion MongoDB et MongoDB Atlas, et Utilisation d'une connexion MongoDB ou MongoDB Atlas.	6 février 2023
Prise en charge de l'analyse des tables Delta Lake à l'aide d'un connecteur Delta Lake natif	Ajout d'informations sur l'utilisation AWS Glue pour parcourir les tables de Delta Lake à l'aide d'un connecteur Delta Lake natif. Cette fonctionnalité vous permet d'utiliser des moteurs de AWS requête pour interroger directement le journal des transactions Delta et d'utiliser des fonctionnalités telles que le voyage dans le temps et les garanties ACID, et de synchroniser vos métadonnées Delta Lake à partir des fichiers de transactions Amazon S3 dans le catalogue de données afin d'activer les autorisations de colonne sur vos requêtes dans Lake Formation. Pour plus d'informations, veuillez consulter les rubriques Comment préciser les options de configuration pour un magasin de données Delta Lake et Interrogation des tables Delta Lake.	15 décembre 2022
Support pour la qualité AWS Glue des données (version préliminaire)	Support est désormais disponible pour AWS Glue Data Quality (version préliminaire). AWS Glue La qualité des données vous permet d'évaluer et de contrôler la qualité de vos données lorsque vous utilisez la AWS Glue version 3.0. Pour plus d'informations sur l'utilisation de la qualité AWS Glue des données avec le catalogue de données, voir QualitéAWS Glue des données (version préliminaire). Pour en savoir plus sur la qualité AWS Glue des données pour AWS Glue Studio, consultez la section Évaluation de la qualité des données avec AWS Glue Studio.	30 novembre 2022
Prise en charge d'un nouveau connecteur Amazon Redshift Spark avec de nouvelles fonctionnalités et des améliorations de performances	Support est désormais disponible pour un nouveau connecteur Amazon Redshift Spark doté d'un nouveau pilote JDBC à utiliser avec des tâches AWS Glue ETL afin de créer des applications Apache Spark capables de lire et d'écrire sur des données dans Amazon Redshift dans le cadre de vos pipelines d'ingestion et de transformation des données. Pour plus d'informations, consultez la rubrique Moving data to and from Amazon Redshift (Déplacement de données vers et depuis Amazon Redshift).	29 novembre 2022
Support pour AWS Glue la version 4.0.	Ajout d'informations sur le support de AWS Glue la version 4.0. Les fonctionnalités incluent la prise en charge native des infrastructures de lacs de données ouvertes avec Apache Hudi, Delta Lake et Apache Iceberg, ainsi que la prise en charge native du plug-in Cloud Shuffle Storage basé sur Amazon S3 (un plug-in Apache Spark) qui utilise Amazon S3 pour le brassage et une capacité de stockage élastique. Pour plus d'informations, consultez les notes AWS Glue de publication et la migration des AWS Glue tâches vers la AWS Glue version 4.0.	28 novembre 2022
AWS Glue Studio propose désormais des transformations visuelles personnalisées	Les transformations visuelles personnalisées permettent aux clients de définir, de réutiliser et de partager une logique ETL spécifique à l'entreprise avec leurs équipes. Pour plus d'informations, consultez Custom visual transforms (Transformations visuelles personnalisées).	28 novembre 2022
Support pour l'utilisation du AWS Glue robot d'exploration pour publier des métadonnées pour les magasins de données JDBC	Support est désormais disponible pour l'utilisation du AWS Glue robot d'exploration pour publier des métadonnées telles que des commentaires et des types bruts dans le catalogue de données pour les magasins de données JDBC. Pour plus d'informations, voir Paramètres définis sur les tables du catalogue de données par robot, propriétés du robot et JdbcTarget structure.	18 novembre 2022
Prise en charge de l'indexation des magasins de données Snowflake	Support est désormais disponible AWS Glue pour explorer les tables et les vues Snowflake et pour publier les métadonnées dans le catalogue de données sous forme d'entrée de table. Pour les tables externes Snowflake dans Amazon S3, le crawler analyse également l'emplacement Amazon S3 et le type de format de fichier de la table externe et les renseigne en tant que paramètres de table. Pour plus d'informations, consultez Which data stores can I crawl? (Quels magasins de données puis-je analyser ?), les propriétés de connexion AWS Glue et les paramètres définis sur les tables du catalogue de données par un crawler.	18 novembre 2022
Prise en charge d'une meilleure gestion du brassage de vos applications Spark	Désormais, la prise en charge d'un nouveau plug-in Cloud Shuffle Storage pour Apache Spark est disponible. Pour plus d'informations, consultez AWS Glue Spark shuffle plugin with Amazon S3 et Cloud Shuffle Storage Plugin for Apache Spark.	15 novembre 2022
Ajout de la prise en charge des cibles du catalogue de données lors de l'accélération des analyses (notifications d'événements Amazon S3)	Outre le support existant pour les cibles Amazon S3, un support est désormais disponible pour accélérer les analyses des cibles du catalogue de données à l'aide des notifications d'événements Amazon S3. Pour en savoir plus, consultez Accélération des analyses à l'aide des notifications d'événements Amazon S3.	13 octobre 2022
Support permettant de spécifier le nombre maximum de tables qu'un crawler peut créer	Le support est désormais disponible pour spécifier le nombre maximum de tables que le crawler est autorisé à créer. Pour plus d'informations, consultez la rubrique Comment spécifier le nombre maximum de tables que le crawler est autorisé à créer.	6 septembre 2022
Support de Python 3.9 dans les jobs shell Python dans AWS Glue	Support est désormais disponible pour l'exécution de scripts compatibles avec Python 3.9 dans les jobs shell Python et pour le choix d'utiliser des ensembles de bibliothèques préemballés. AWS Glue Pour en savoir plus, consultez Tâches Python shell dans AWS Glue.	11 août 2022
Support pour exécuter des AWS Glue tâches non urgentes ou non urgentes avec des capacités inutilisées	La prise en charge est désormais disponible pour la configuration d'exécutions de tâches flexibles pour les tâches non urgentes telles que les tâches de pré-production, les tests et les chargements de données ponctuels. Pour plus d'informations, consultez la section Ajout de tâches AWS Glue.	9 août 2022
Prise en charge d'un nouveau type d'employé pour les tâches de streaming	Une prise en charge est désormais disponible pour une utilisation du type d'employé `G.025X` pour les tâches de streaming à faible volume. Pour plus d'informations, consultez la section Ajout de tâches AWS Glue.	14 juillet 2022
Support pour l'utilisation de Kafka SASL dans les connexions AWS Glue	Support est désormais disponible pour l'utilisation de Kafka SASL dans les AWS Glue connexions. Pour plus d'informations, consultez Propriétés de connexion Kafka AWS Glue pour l'authentification du client.	5 juillet 2022
Prise en charge du connecteur Apache Kafka pour schémas Protobuf	La prise en charge du connecteur Apache Kafka est désormais disponible pour schémas Protobuf. Pour plus d'informations, consultez Registre de schémas AWS Glue.	9 juin 2022
Support pour Auto Scaling for AWS Glue jobs (GA)	Ajout d'informations sur l'utilisation d'Auto Scaling pour les tâches dans AWS Glue la version 3.0 afin de dimensionner dynamiquement les ressources de calcul. Pour plus d'informations, consultez Utilisation d'Auto Scaling pour AWS Glue.	14 avril 2022
Mise à jour de la documentation pour le AWS Glue développement et le test de scripts de AWS Glue travail	Informations réorganisées et ajoutées sur les méthodes de développement et de test disponibles pour AWS Glue, y compris les instructions pour le développement avec Docker. Pour plus d'informations, consultez la section Développement et test de scripts de AWS Glue travail.	14 mars 2022
Ajout de tampons de protocole (protobuf) en tant que format de données pris en charge pour le registre de schémas AWS Glue	Ajout d'informations sur Protobuf en tant que format de données pris en charge (en plus d'AVRO et de JSON). Pour plus d'informations, consultez Registre de schémas AWS Glue.	25 février 2022
Prise en charge des tables rampantes Delta Lake	Ajout d'informations sur l'utilisation AWS Glue pour parcourir les tables de Delta Lake. Pour plus d'informations, consultez Comment préciser les options de configuration pour un magasin de données Delta Lake.	24 février 2022
Support pour obtenir des informations sur les AWS Glue offres d'emploi	Ajout d'informations sur l'utilisation AWS Glue des informations sur les tâches pour simplifier le débogage des tâches et l'optimisation de vos AWS Glue tâches. Pour plus d'informations, consultez la section Surveillance à l'aide des informations sur les AWS Glue emplois.	8 février 2022
Prise en charge de l'analyse des tables du catalogue de données basées sur Amazon S3 à l'aide d'un point de terminaison d'un VPC	En plus des magasins de données Amazon S3, vous pouvez configurer vos tables du catalogue de données basées sur Amazon S3 pour qu'ils soient accessibles uniquement par un environnement Amazon Virtual Private Cloud (Amazon VPC), à des fins de sécurité, d'audit ou de contrôle. Pour plus d'informations, consultez Analyse d'un magasin de données Amazon S3 ou tables du catalogue de données basées sur Amazon S3 à l'aide d'un point de terminaison d'un VPC.	3 février 2022
Support des tables régies de Lake Formation	Ajout d'informations sur la AWS Glue prise en charge des tables gouvernées par Lake Formation, qui prennent en charge les transactions ACID, le compactage automatique des données et les requêtes de voyage dans le temps. Pour en savoir plus, consultez API AWS Glue et le guide du développeur AWS Lake Formation.	30 novembre 2021
Nouvelles politiques AWS gérées ajoutées pour les sessions interactives et les blocs-notes	Les nouvelles politiques gérées pour IAM ont renforcé la sécurité lors de l'utilisation AWS Glue des sessions interactives et des blocs-notes. Pour plus d'informations, veuillez consulter la rubrique Politiques gérées par AWS pour AWS Glue.	30 novembre 2021
Registre de schémas Glue désormais supportés avec les tâches de streaming	Vous pouvez créer des tâches de streaming qui accèdent aux tables qui font partie du registre de schéma Glue. Pour en savoir plus, consultez Registre de schémas AWS Glue et Ajouter des tâches ETL de streaming dans AWS Glue.	15 novembre 2021
Support des nouvelles fonctions de machine learning	Ajout d'informations sur les nouvelles fonctions de transformation machine learning Rechercher de correspondances, y compris la correspondance progressive et la notation des correspondances. Pour en savoir plus, consultez Recherche de correspondances progressives et Estimation de la qualité des correspondances à l'aide des notes de confiance des correspondances.	31 octobre 2021
(Aperçu privé) Support pour les jobs AWS Glue flexibles	Ajout d'informations sur la configuration des tâches AWS Glue Spark avec une classe d'exécution flexible, adaptée aux tâches non urgentes dont les heures de début et de fin peuvent varier. Pour plus d'informations, consultez la section Ajout de tâches AWS Glue.	29 octobre 2021
Support d'accélération des explorations à l'aide des notifications d'événements Amazon S3	Ajout d'informations sur l'accélération des explorations à l'aide des notifications d'événements Amazon S3. Pour en savoir plus, consultez Accélération des explorations à l'aide des notifications d'événements Amazon S3.	15 octobre 2021
Options de configuration de sécurité supplémentaires liées au contrôle d'accès et VPCs	Ajout d'informations sur la façon dont vous pouvez configurer les nouvelles autorisations de contrôle d'accès AWS Glue et la configuration de VPCs. Pour plus d'informations, consultez les sections AWS Balises AWS Glue, politiques basées sur l'identité (politiques IAM) qui contrôlent les paramètres à l'aide de clés de condition ou de clés contextuelles, et Configuration de tous les AWS appels pour qu'ils passent par votre VPC.	13 octobre 2021
Support des politiques de point de terminaison d'un VPC	Ajout d'informations sur le support des politiques de point de terminaison Virtual Private Cloud (VPC) dans AWS Glue. Pour en savoir plus, consultez la section relative à AWS Glue et points de terminaison VPC d'interface (AWS PrivateLink).	11 octobre 2021
Glue Studio est désormais disponible en Chine	AWS Glue Studio est désormais disponible dans les régions de Pékin et de Ningxia en Chine.	11 octobre 2021
AWS Glue Studio propose la création de blocs-notes, pour une édition interactive des tâches	Les blocs-notes vous permettent d'écrire et d'exécuter du code, de visualiser les résultats et de partager des informations. En général, les spécialistes des données utilisent des blocs-notes pour des expériences et des tâches d'exploration de données. Pour plus d'informations, consultez Using Notebooks (Utilisation des blocs-notes).	1er octobre 2021
Un accès direct aux sources de streaming est désormais disponible	Lorsque vous ajoutez des sources de données à votre tâche ETL dans l'éditeur visuel, vous pouvez fournir des informations pour accéder au flux de données au lieu d'utiliser une base de données et une table du catalogue de données.	30 septembre 2021
A documenté la politique de support des AWS Glue versions	Ajout d'informations sur la politique de support des AWS Glue versions et les phases de fin de vie de certaines AWS Glue versions. Pour en savoir plus, consultez politique de prise en charge de version AWS Glue.	24 septembre 2021
Les connecteurs personnalisés peuvent désormais être utilisés avec des prévisualisations de données	Lorsque vous modifiez un nœud de source de données à l’aide d’un connecteur personnalisé, vous pouvez prévisualiser le jeu de données en cliquant sur l’onglet Aperçu des données. Pour plus d'informations, consultez Custom Connectors (Connecteurs personnalisés).	24 septembre 2021
Support pour les sessions AWS Glue interactives (aperçu privé)	(Aperçu privé) Ajout d'informations sur l'utilisation de sessions AWS Glue interactives pour exécuter des charges de travail Spark dans le cloud à partir de n'importe quel bloc-notes Jupyter. Les sessions interactives constituent la méthode préférée pour développer votre code AWS Glue d'extraction, de transformation et de chargement (ETL) lorsque vous utilisez la AWS Glue version 2.0 ou une version ultérieure. Pour plus d'informations, voir Configuration et exécution de sessions AWS Glue interactives pour Jupyter Notebook.	24 août 2021
Prise en charge de la création de flux de travail à partir de plans (GA)	Ajout d'informations sur le codage des cas d'utilisation courants Extract-transform-load (ETL) dans les modèles, puis sur la création de flux de travail à partir de modèles. Permet aux analystes de données de créer et d'exécuter facilement des processus ETL complexes. Pour plus d'informations, consultez Exécution d'activités ETL complexes à l'aide de plans et de flux de travail dans AWS Glue.	23 août 2021
Support pour AWS Glue la version 3.0.	Ajout d'informations sur la prise en charge de la AWS Glue version 3.0, qui prend en charge la mise à niveau du moteur Apache Spark 3.0 pour l'exécution des tâches ETL Apache Spark, ainsi que d'autres optimisations et mises à niveau. Pour plus d'informations, consultez les notes AWS Glue de publication et la migration des AWS Glue tâches vers la AWS Glue version 3.0. Les autres fonctionnalités de cette version incluent le gestionnaire de AWS Glue shuffle, un lecteur CSV vectorisé SIMD et des prédicats de partition de catalogue. Pour plus d'informations, consultez le gestionnaire de shuffle AWS Glue Spark avec Amazon S3, les options de format pour les entrées et sorties ETL AWS Glue, et le filtrage côté serveur à l'aide de prédicats de partition de catalogue.	18 août 2021
AWS GovCloud (US) Region	AWS Glue Studio est désormais disponible dans AWS GovCloud (US) Region	18 août 2021
La création de shell Python est disponible dans AWS Glue Studio	Lors de la création d'une nouvelle tâche, vous pouvez maintenant choisir de créer une tâche shell Python. Pour en savoir plus, consultez Start the job creation process et Editing Python shell jobs in AWS Glue Studio.	13 août 2021
Support pour démarrer un flux de travail avec un EventBridge événement Amazon	Ajout d'informations sur la manière d' AWS Glue être un consommateur d'événements dans une architecture axée sur les événements. Pour plus d'informations, consultez Démarrer un AWS Glue flux de travail avec un EventBridge événement Amazon et Afficher les EventBridge événements qui ont démarré un flux de travail.	14 juillet 2021
Ajout de JSON en tant que format de données pris en charge pour le registre de AWS Glue schémas	Ajout d'informations sur JSON en tant que format de données pris en charge (en plus d'AVRO). Pour de plus amples informations, veuillez consulter Registre de schémas AWS Glue.	30 Juin 2021
Créez des tâches de AWS Glue streaming sans table de catalogue de données	La fonction Python `create_data_frame_from_options` ou `getSource` pour les scripts Scala prennent en charge la création de tâches ETL en streaming qui référencent directement les flux de données au lieu de nécessiter une table Data Catalog.	15 juin 2021
AWS Glue l'apprentissage automatique transforme désormais les AWS Key Management Service clés de support	Vous pouvez spécifier une configuration ou une AWS KMS clé de sécurité lorsque vous configurez des transformations de AWS Glue Machine Learning à l'aide de la console, de la CLI ou du AWS Glue APIs. Pour de plus amples informations, veuillez consulter Utilisation du chiffrement des données avec les transformations de machine learning et API de machine learning AWS Glue.	15 juin 2021
Mise à jour de la politique AWSGlue ConsoleFullAccess AWS gérée	Ajout d'informations concernant une mise à jour mineure de la politique AWSGlue ConsoleFullAccess AWS gérée. Pour plus d'informations, voir AWS Glue Mises à jour des politiques AWS gérées.	10 juin 2021
Afficher le jeu de données de votre tâche lors de la création et de la modification des tâches	Vous pouvez utiliser le nouveau module Data preview (Prévisualisation des données) d'un nœud dans votre diagramme de tâche pour afficher un échantillon des données traitées par ce nœud. Pour de plus amples informations, veuillez consulter la rubrique Utilisation des prévisualisations de données dans l'éditeur de tâches visuel.	7 juin 2021
Prise en charge de la spécification d'une valeur qui indique l'emplacement de la table pour la sortie du crawler.	Ajout d'informations sur la spécification d'une valeur indiquant l'emplacement de la table lors de la configuration de la sortie du crawler. Pour de plus amples informations, veuillez consulter Procédure pour spécifier l'emplacement de la table.	4 juin 2021
Prise en charge de l'analyse d'un échantillon de fichiers dans un jeu de données lors de l'exploration d'un magasin de données Amazon S3	Ajout d'informations sur l'analyse d'un échantillon de fichiers lors de l'analyse d'Amazon S3. Pour plus d'informations, consultez Propriétés de l'crawler.	10 mai 2021
Support pour le parquettiste AWS Glue optimisé	Ajout d'informations sur l'utilisation du rédacteur de parquet AWS Glue optimisé DynamicFrames pour créer ou mettre à jour des tableaux avec la `parquet` classification. Pour plus d'informations, voir Création de tables, mise à jour du schéma et ajout de nouvelles partitions dans le catalogue de données à partir de tâches AWS Glue ETL et Options de format pour les entrées et sorties ETL dans AWS Glue.	4 mai 2021
Prise en charge des mots de passe pour l'authentification du client Kafka	Ajout d'informations sur la façon dont le streaming de tâches ETL AWS Glue prend en charge l'authentification par certificat client SSL auprès des producteurs de flux Apache Kafka. Vous pouvez désormais fournir un certificat personnalisé lors de la définition d'une AWS Glue connexion à un cluster Apache Kafka, qui AWS Glue sera utilisé lors de l'authentification auprès de celui-ci. Pour plus d'informations, consultez Propriétés de connexion AWS Glue et API de connexion.	28 avril 2021
Prise en charge de la consommation de données d'Amazon Kinesis Data Streams dans un autre compte dans les tâches ETL de streaming	Ajout d'informations sur la création d'une tâche ETL de streaming pour consommer les données d'Amazon Kinesis Data Streams dans un autre compte. Pour plus d'informations, consultez la section Ajout de tâches ETL en streaming dans AWS Glue.	30 mars 2021
Transformation SQL disponible	Vous pouvez utiliser un nœud de transformation SQL pour écrire votre propre transformation sous la forme d'une requête SQL. Pour de plus amples informations, veuillez consulter la rubrique Utilisation d'une requête SQL pour transformer des données.	23 mars 2021
Prise en charge de la création de flux de travail à partir de plans (version préliminaire publique)	(Version préliminaire publique) Ajout d'informations sur le codage des cas d'utilisation courants Extract-transform-load (ETL) dans les modèles, puis sur la création de flux de travail à partir de modèles. Permet aux analystes de données de créer et d'exécuter facilement des processus ETL complexes. Pour plus d'informations, consultez Exécution d'activités ETL complexes à l'aide de plans et de flux de travail dans AWS Glue.	22 mars 2021
Les connecteurs peuvent être utilisés pour les cibles de données	L'utilisation d'un AWS Marketplace connecteur ou d'un personnalisé pour votre cible de données est désormais prise en charge. Pour de plus amples informations, veuillez consulter la rubrique Création de tâches avec des connecteurs personnalisés.	15 mars 2021
Support des indicateurs d'importance des colonnes pour les transformations du AWS Glue machine learning	Ajout d'informations sur l'affichage des indicateurs d'importance des colonnes lors de l'utilisation de transformations de AWS Glue machine learning. Pour plus d'informations, voir Utilisation des transformations du Machine Learning sur la AWS Glue console.	5 février 2021
La planification des tâches est désormais disponible dans AWS Glue Studio	Vous pouvez définir une planification temporelle pour l'exécution de vos tâches dans AWS Glue Studio. Vous pouvez utiliser la console pour créer une planification de base, ou définir une planification plus complexe à l'aide de la syntaxe de type Unix cron. Pour de plus amples informations, veuillez consulter la rubrique Planification des exécutions de tâches.	21 décembre 2020
AWS Glue Connecteurs personnalisés publiés	AWS Glue Les connecteurs personnalisés vous permettent de découvrir et de vous abonner à des connecteurs dans AWS Marketplace. Nous avons également publié des interfaces d'exécution AWS Glue Spark pour intégrer des connecteurs conçus pour Apache Spark Datasource, Athena federated Query et JDBC. APIs Pour plus d'informations, consultez la section Utilisation de connecteurs et de connexions avec AWS Glue Studio.	21 décembre 2020
Support pour l'exécution de tâches ETL en streaming dans AWS Glue la version 2.0	Ajout d'informations sur la prise en charge de l'exécution de tâches ETL en streaming dans Glue version 2.0. Pour plus d'informations, consultez la section Ajout de tâches ETL en streaming dans AWS Glue.	18 décembre 2020
Prise en charge du partitionnement de la charge de travail avec exécution limitée	Ajout d'informations sur l'activation du partitionnement de la charge de travail pour configurer les limites supérieures de la taille du jeu de données ou du nombre de fichiers traités lors des exécutions de tâches ETL. Pour de plus amples informations, veuillez consulter Partitionnement de la charge de travail avec exécution limitée.	23 novembre 2020
Prise en charge de la gestion améliorée des partitions	Ajout d'informations sur la façon d'utiliser new APIs pour ajouter ou supprimer une partition, indexer to/from une table existante. Pour plus d'informations, consultez Utilisation des index de partition.	23 novembre 2020
Support pour le registre des AWS Glue schémas	Ajout d'informations sur l'utilisation du registre des AWS Glue schémas pour découvrir, contrôler et faire évoluer les schémas de manière centralisée. Pour plus d'informations, consultez la section Registre des AWS Glue schémas.	19 novembre 2020
Prise en charge du format de saisie de Grok dans les tâches ETL de streaming	Ajout d'informations sur l'application de modèles Grok aux sources de streaming telles que les fichiers journaux. Pour de plus amples informations, veuillez consulter Application de modèles Grok à des sources de streaming.	17 novembre 2020
Support pour l'ajout de balises aux flux de travail sur la AWS Glue console	Ajout d'informations sur l'ajout de balises lors de la création d'un flux de travail à l'aide de la console AWS Glue . Pour plus d'informations, voir Création et développement d'un flux de travail à l'aide de la AWS Glue console.	27 octobre 2020
Prise en charge des exécutions progressives du crawler	Ajout d'informations sur la prise en charge des exécutions incrémentielles du crawler, qui n'analysent que les dossiers Amazon S3 ajoutés depuis la dernière exécution. Pour de plus amples informations, veuillez consulter Analyses incrémentielles.	21 octobre 2020
Prise en charge de la détection de schéma pour les sources de données ETL en streaming. Prise en charge des sources de données ETL en streaming Avro et Kafka autogéré	Les tâches d'extraction, de transformation et de chargement (ETL) en streaming AWS Glue peuvent désormais détecter automatiquement le schéma des enregistrements entrants et gérer les modifications de schéma par enregistrement. Les sources de données Kafka autogérées sont désormais prises en charge. Les tâches ETL en streaming prennent désormais en charge le format Avro dans les sources de données. Pour plus d'informations, consultez Streaming ETL in AWS Glue, Defining Job Properties for a Streaming ETL Job et Remarques et restrictions pour les sources de streaming Avro.	7 octobre 2020
Prise en charge de l'analyse des sources de données MongoDB et DocumentDB	Ajout d'informations sur la prise en charge de l'analyse des sources de données MongoDB et Amazon DocumentDB (avec compatibilité MongoDB). Pour plus d'informations, consultez Définition des crawlers.	5 octobre 2020
Prise en charge de la conformité FIPS	Ajout d'informations sur les points de terminaison FIPS pour les clients qui ont besoin de modules cryptographiques validés FIPS 140-2 lors de l'accès aux données à l'aide de AWS Glue. Pour plus d'informations, consultez Conformité FIPS.	23 septembre 2020
AWS Glue Studio fournit une interface visuelle facile à utiliser pour la création et le suivi des emplois	Vous pouvez désormais utiliser une interface graphique simple pour composer des tâches qui déplacent et transforment les données et les exécutent sur AWS Glue. Vous pouvez ensuite utiliser le tableau de bord d'exécution des tâches dans AWS Glue Studio pour contrôler l'exécution ETL et vous assurer que vos tâches fonctionnent comme prévu. Pour plus d’informations, consultez le AWS Glue Studio guide de l’utilisateur.	23 septembre 2020
Prise en charge de la création d'index de tableau pour améliorer les performances des requêtes	Ajout d'informations sur la création d'index de table pour vous permettre de récupérer un sous-ensemble des partitions d'une table. Pour plus d'informations, consultez Utilisation des index de partition.	9 septembre 2020
Support de temps de démarrage réduits lors de l'exécution de tâches ETL Apache Spark dans la version 2.0 de AWS Glue.	Ajout d'informations sur la prise en charge de la AWS Glue version 2.0, qui fournit une infrastructure améliorée pour exécuter les tâches ETL Apache Spark avec des temps de démarrage réduits, des modifications dans la journalisation et la prise en charge de la spécification de modules Python supplémentaires au niveau des tâches. Pour de plus amples informations, veuillez consulter Notes de mise à jour AWS Glue et Exécution de tâches ETL Spark avec des temps de démarrage réduits.	10 août 2020
Prise en charge de la limitation du nombre d'exécutions de flux de travail simultanées.	Ajout d'informations sur la manière de limiter le nombre d'exécutions de flux de travail simultanées pour un flux de travail particulier. Pour plus d'informations, voir Création et développement d'un flux de travail à l'aide de la AWS Glue console.	10 août 2020
Prise en charge de l'analyse d'un stock de données Amazon S3 à l'aide d'un point de terminaison d'un VPC	Ajout d'informations sur la configuration de votre magasin de données Amazon S3 pour qu'il soit accessible uniquement par un environnement Amazon Virtual Private Cloud (Amazon VPC), à des fins de sécurité, d'audit ou de contrôle. Pour de plus amples informations, veuillez consulter Analyse d'un magasin de données Amazon S3 à l'aide d'un point de terminaison VPC.	7 août 2020
Prise en charge de la reprise des exécutions de flux de travail	Ajout d'informations sur la façon de reprendre les exécutions de flux de travail qui ne se sont que partiellement terminées, car un ou plusieurs nœuds (tâches ou crawlers) ne se sont pas terminés avec succès. Pour plus d'informations, consultez Réparer et reprendre l'exécution d'un flux de travail.	27 juillet 2020
Prise en charge de l'activation des certificats d'autorité de certification privés dans les connexions Kafka au format AWS Glue.	Ajout d'informations sur les nouvelles options de connexion qui prennent en charge l'activation des certificats d'autorité de certification privés pour les connexions Kafka dans AWS Glue. Pour plus d'informations, voir Types de connexion et options pour l'ETL dans AWS Glue et Paramètres spéciaux utilisés par AWS Glue.	20 juillet 2020
Prise en charge de la lecture des données DynamoDB dans un autre compte	Ajout d'informations sur la AWS Glue prise en charge de la lecture de données depuis la table DynamoDB d'un autre AWS compte Pour plus d'informations, voir Lecture à partir de données DynamoDB dans un autre compte.	17 juillet 2020
Support pour une connexion d'enregistreur DynamoDB AWS Glue dans la version 1.0 ou ultérieure	Ajout d'informations sur la prise en charge de l'écrivain DynamoDB et des options de connexion nouvelles ou mises à jour pour la lecture ou l'écriture de DynamoDB. Pour plus d'informations, veuillez consulter Types de connexion et options de connexion pour ETL dans AWS Glue.	17 juillet 2020
Prise en charge des liens de ressources et du contrôle d'accès entre différents comptes en utilisant à la fois AWS Glue et Lake Formation	Ajout de contenu sur les nouveaux objets du catalogue de données appelés liens de ressources, et sur la façon de gérer le partage des ressources du catalogue de données entre les comptes avec AWS Glue les deux AWS Lake Formation. Pour de plus amples informations, veuillez consulter Octroi d'un accès intercompte et Liens de ressources de table.	7 juillet 2020
Prise en charge des registres d'échantillonnage lors de l'analyse des stocks de données DynamoDB	Ajout d'informations sur les nouvelles propriétés que vous pouvez configurer lors de l'analyse d'un magasin de données DynamoDB. Pour plus d'informations, consultez Propriétés de l'crawler.	12 juin 2020
Prise en charge de l'arrêt d'une exécution de flux de travail.	Ajout d'informations sur la façon d'arrêter le cycle d'un flux de travail spécifique. Pour plus d'informations, consultez Arrêt d'un cycle de flux de travail.	14 mai 2020
Prise en charge des tâches ETL Spark Streaming	Ajout d'informations sur la création de tâches d'extraction, de transformation et de chargement (ETL) avec des sources de données en streaming. Pour de plus amples informations, consultez Ajout de tâches ETL en streaming dans AWS Glue.	27 avril 2020
Prise en charge de la création de tableaux, de la mise à jour du schéma et de l'ajout de nouvelles partitions dans le catalogue de données après l'exécution d'une tâche ETL	Ajout d'informations sur la façon dont vous pouvez activer la création de tables, la mise à jour du schéma et l'ajout de nouvelles partitions pour afficher les résultats de votre tâche ETL dans le catalogue de données. Pour plus d'informations, voir Création de tables, mise à jour du schéma et ajout de nouvelles partitions dans le catalogue de données à partir de tâches AWS Glue ETL.	2 avril 2020
Support pour spécifier une version pour le format de données Apache Avro en tant qu'entrée et sortie ETL dans AWS Glue	Ajout d'informations sur la spécification d'une version pour le format de données Apache Avro en tant qu'entrée et sortie ETL dans AWS Glue. Version par défaut 1.7. Vous pouvez utiliser l'option de format `version` pour spécifier à Avro 1.8 d'activer la lecture/écriture logique. Pour plus d'informations, consultez la section Options de format pour les entrées et sorties ETL dans AWS Glue.	31 mars 2020
Prise en charge du validateur EMRFS optimisé pour S3 dans le cadre de l'écriture de données Parquet dans Amazon S3	Ajout d'informations sur la façon de définir un nouvel indicateur pour activer le validateur EMRFR optimisé pour S3 dans le cadre de l'écriture de données Parquet sur Amazon S3 lors de la création ou de la mise à jour d'une tâche AWS Glue . Pour plus d'informations, consultez la section Paramètres spéciaux utilisés par AWS Glue.	30 mars 2020
Support à l'apprentissage automatique : transformation en tant que ressource gérée par AWS des balises de ressources	Des informations supplémentaires sur l'utilisation de balises de AWS ressources pour gérer et contrôler l'accès à votre machine learning se transforment AWS Glue. Vous pouvez attribuer AWS des balises de ressources aux tâches, aux déclencheurs, aux points de terminaison, aux robots d'exploration et aux transformations de machine learning. AWS Glue Pour plus d'informations, consultez la section AWS Tags in AWS Glue.	2 mars 2020
Prise en charge des arguments de tâche non substituables	Ajout d'informations sur la prise en charge des paramètres de tâche spéciaux qui ne peuvent pas être remplacés dans les déclencheurs ou lorsque vous exécutez la tâche. Pour plus d'informations, consultez Ajout de tâches dans AWS Glue.	12 février 2020
Prise en charge des nouvelles transformations pour l'utilisation des jeux de données dans Amazon S3	Ajout d'informations sur les nouvelles transformations (Fusion, Purge et Transition) et sur les exclusions de classe de stockage Amazon S3 pour les applications Apache Spark dans le cadre de l'utilisation des ensembles de données dans Amazon S3. Pour plus d'informations sur la prise en charge de ces transformations pour Python, consultez la section Utilisation mergeDynamicFramedes ensembles de données dans Amazon S3. Pour Scala, voir mergeDynamicFrameset AWS Glue Scala GlueContext APIs.	16 janvier 2020
Prise en charge de la mise à jour du catalogue de données avec les informations des nouvelles partitions à partir d'une tâche ETL	Ajout d'informations sur la façon de coder un script d'extraction, de transformation et de chargement (ETL) pour mettre à jour les informations de partition AWS Glue Data Catalog avec de nouvelles informations. Avec cette fonctionnalité, vous n'avez plus besoin de réexécuter le crawler à la fin de la tâche pour afficher les nouvelles partitions. Pour plus d'informations, consultez Mise à jour de Data Catalog avec de nouvelles partitions.	15 janvier 2020
Nouveau tutoriel : Utilisation d'un bloc-notes basé sur SageMaker l'IA	Ajout d'un didacticiel qui explique comment utiliser un SageMaker bloc-notes Amazon pour développer vos scripts ETL et d'apprentissage automatique. Consultez le didacticiel : utilisez un SageMaker bloc-notes Amazon avec votre terminal de développement.	3 janvier 2020
Prise en charge de la lecture depuis MongoDB et Amazon DocumentDB (avec compatibilité MongoDB)	Ajout d'informations sur les nouveaux types de connexion et options de connexion pour la lecture et l'écriture dans MongoDB et Amazon DocumentDB (avec compatibilité MongoDB). Pour plus d'informations, veuillez consulter Types de connexion et options de connexion pour ETL dans AWS Glue.	17 décembre 2019
Corrections et clarifications diverses	Des corrections et des clarifications ont été ajoutées. Des entrées ont été supprimées du chapitre Problèmes connus. Ajout d'avertissements qui ne prennent AWS Glue en charge que les clés principales symétriques du client (CMKs) lors de la spécification des paramètres de chiffrement du catalogue de données et de la création de configurations de sécurité. Ajout d'une note qui AWS Glue ne prend pas en charge l'écriture sur Amazon DynamoDB.	9 décembre 2019
Prise en charge des pilotes JDBC personnalisés	Ajout d'informations sur la connexion aux sources de données et aux cibles à l'aide de pilotes JDBC qui AWS Glue ne sont pas pris en charge de manière native, tels que MySQL version 8 et Oracle Database version 18. Pour plus d'informations, consultez JDBC connectionType Values.	25 novembre 2019
Support pour connecter des ordinateurs portables SageMaker dotés d'intelligence artificielle à différents terminaux de développement	Ajout d'informations sur la façon dont vous pouvez connecter un bloc-notes SageMaker AI à différents terminaux de développement. Mises à jour décrivant la nouvelle action de console pour passer à un nouveau point de terminaison de développement, ainsi que la nouvelle politique SageMaker AI IAM. Pour plus d'informations, consultez les sections Utilisation des blocs-notes sur la AWS Glue console et Création d'une politique IAM pour les blocs-notes Amazon SageMaker AI.	21 novembre 2019
Support des AWS Glue versions lors des transformations liées à l'apprentissage automatique	Ajout d'informations sur la définition de la AWS Glue version dans une transformation d'apprentissage automatique pour indiquer la version compatible avec laquelle AWS Glue une transformation d'apprentissage automatique est compatible. Pour plus d'informations, voir Travailler avec les transformations du Machine Learning sur la AWS Glue console.	21 novembre 2019
Prise en charge de la restauration de vos favoris de tâche	Ajout d'informations sur la restauration de vos marque-pages de tâche sur une exécution de tâche précédente, ce qui entraîne le retraitement des données de l'exécution de tâche suivante uniquement à partir de l'exécution de travail marquée en favori. Décrit deux nouvelles sous-options pour l'option `job-bookmark-pause`, qui vous permettent d'exécuter une tâche entre deux favoris. Pour plus d'informations, voir Suivi des données traitées à l'aide des signets de tâches et des paramètres spéciaux utilisés par AWS Glue.	22 octobre 2019
Prise en charge des certificats JDBC personnalisés pour la connexion à un stock de données	Ajout d'informations sur la AWS Glue prise en charge des certificats JDBC personnalisés pour les connexions SSL aux sources de AWS Glue données ou aux cibles. Pour plus d'informations, consultez Utilisation des connexions sur la console AWS Glue.	10 octobre 2019
Prise en charge de Python wheel	Ajout d'informations sur la prise en AWS Glue charge des fichiers wheel (ainsi que des fichiers egg) en tant que dépendances pour les tâches shell Python. Pour plus d'informations, consultez Ajout de votre propre bibliothèque Python.	26 septembre 2019
Support pour le versionnement des terminaux de développement dans AWS Glue	Ajout d'informations sur la définition des points de terminaison `Glue version` en cours de développement. `Glue version`détermine les versions d'Apache Spark et de Python prises AWS Glue en charge. Pour plus d'informations, consultez Ajout d'un point de terminaison de développement.	19 septembre 2019
Support pour la surveillance à AWS Glue l'aide de l'interface utilisateur Spark	Ajout d'informations sur l'utilisation de l'interface utilisateur d'Apache Spark pour surveiller et déboguer les tâches AWS Glue ETL exécutées sur le système de AWS Glue tâches, ainsi que sur les applications Spark sur les points de terminaison de AWS Glue développement. Pour plus d'informations, consultez la section Surveillance à AWS Glue l'aide de l'interface utilisateur Spark.	19 septembre 2019
Amélioration de la prise en charge du développement de script ETL local à l'aide de la AWS Glue bibliothèque ETL publique	Le contenu de la bibliothèque AWS Glue ETL a été mis à jour pour indiquer que AWS Glue la version 1.0 est désormais prise en charge. Pour plus d'informations, voir Développement et test de scripts ETL localement à l'aide de la bibliothèque AWS Glue ETL.	18 septembre 2019
Prise en charge de l'exclusion des classes de stockage Amazon S3 lors de l'exécution de tâches	Ajout d'informations sur l'exclusion des classes de stockage Amazon S3 lors de l'exécution de tâches AWS Glue ETL qui lisent des fichiers ou des partitions depuis Amazon S3. Pour de plus amples informations, veuillez consulter Exclusion des classes de stockage Amazon S3.	29 août 2019
Support pour le développement de scripts ETL locaux à l'aide de la bibliothèque AWS Glue ETL publique	Ajout d'informations sur la façon de développer et de tester des scripts ETL Python et Scala localement sans avoir besoin d'une connexion réseau. Pour plus d'informations, voir Développement et test de scripts ETL localement à l'aide de la bibliothèque AWS Glue ETL.	28 août 2019
Problèmes connus	Ajout d'informations sur les problèmes connus liés à AWS Glue. Pour plus d'informations, consultez Problèmes connus liés à AWS Glue.	28 août 2019
Support à l'apprentissage automatique se transforme AWS Glue	Ajout d'informations sur les fonctionnalités d'apprentissage automatique fournies par AWS Glue pour créer des transformations personnalisées. Vous pouvez créer ces transformations lorsque vous créez une tâche. Pour plus d'informations, consultez Machine Learning Transforms in AWS Glue.	8 août 2019
Prise en charge du cloud privé virtuel partagé d'Amazon	Ajout d'informations sur la AWS Glue prise en charge du partage d'Amazon Virtual Private Cloud. Pour plus d'informations, consultez Shared Amazon VPCs.	6 août 2019
Support pour la gestion des versions dans AWS Glue	Ajout d'informations sur la définition `Glue version` des propriétés de la tâche. AWS Glue version détermine les versions d'Apache Spark et de Python prises AWS Glue en charge. Pour plus d'informations, consultez la section Ajout de tâches AWS Glue.	24 juillet 2019
Prise en charge d'options de configuration supplémentaires pour les points de terminaison de développement	Ajout d'informations sur les options de configuration pour les points de terminaison de développement ayant des charges de travail gourmandes en mémoire. Vous avez le choix entre deux nouvelles configurations qui offrent une plus grande capacité de mémoire par exécuteur. Pour plus d'informations, consultez la section Utilisation des points de terminaison de développement sur la AWS Glue console.	24 juillet 2019
Prise en charge de l'exécution d'activités d'extraction, de transfert et de chargement (ETL) à l'aide de flux de travail	Ajout d'informations sur l'utilisation d'une nouvelle structure appelée flux de travail pour concevoir une activité complexe d'extraction, de transformation et de chargement (ETL) multi-tâches AWS Glue pouvant être exécutée et suivie en tant qu'entité unique. Pour plus d'informations, voir Exécution d'activités ETL complexes à l'aide de flux de travail dans AWS Glue.	20 juin 2019
Prise en charge de Python 3.6 dans les tâches shell Python	Ajout d'informations sur la prise en charge de Python 3.6 dans les tâches shell Python. Vous pouvez spécifier Python 2.7 ou Python 3.6 en tant que propriété de tâche. Pour en savoir plus, consultez Ajout de tâches shell Python dans AWS Glue.	5 juin 2019
Prise en charge des points de terminaison du Virtual Private Cloud (VPC)	Ajout d'informations sur la connexion directe AWS Glue via un point de terminaison d'interface dans votre VPC. Lorsque vous utilisez un point de terminaison d'interface VPC, la communication entre votre VPC et celui-ci AWS Glue s'effectue entièrement et en toute sécurité au sein du réseau. AWS Pour plus d'informations, consultez la section Utilisation AWS Glue avec des points de terminaison VPC.	4 juin 2019
Support pour l'enregistrement continu et en temps réel des AWS Glue tâches.	Ajout d'informations sur l'activation et l'affichage des journaux des tâches Apache Spark en temps réel, CloudWatch notamment les journaux des pilotes, les journaux de chacun des exécuteurs et une barre de progression des tâches Spark. Pour plus d'informations, consultez Journalisation continue des tâches AWS Glue.	28 mai 2019
Prise en charge des tableaux du catalogue de données existantes en tant que sources du crawler	Ajout d'informations sur la spécification d'une liste des tables Data Catalog existantes en tant que sources du crawler. Les crawlers peuvent ensuite détecter des modifications apportées aux schémas de table, mettre à jour les définitions de table et enregistrer de nouvelles partitions au fur et à mesure que de nouvelles données sont disponibles. Pour plus d'informations, consultez Propriétés de l'crawler.	10 mai 2019
Prise en charge des options de configuration supplémentaires pour les tâches gourmandes en mémoire	Ajout d'informations sur les options de configuration pour les tâches Apache Spark avec des charges de travail gourmandes en mémoire. Vous avez le choix entre deux nouvelles configurations qui offrent une plus grande capacité de mémoire par exécuteur. Pour plus d'informations, consultez la section Ajout de tâches AWS Glue.	5 avril 2019
Prise en charge de classifieurs personnalisés CSV	Ajout d'informations sur l'utilisation d'un classifieur CSV personnalisé pour déduire le schéma de différents types de données CSV. Pour plus d'informations, consultez Écriture de classifieurs personnalisés.	26 mars 2019
Support pour les balises AWS de ressources	Ajout d'informations sur l'utilisation AWS des balises de ressources pour vous aider à gérer et à contrôler l'accès à vos AWS Glue ressources. Vous pouvez attribuer AWS des balises de ressources aux tâches, aux déclencheurs, aux points de terminaison et aux robots d'exploration dans. AWS Glue Pour plus d'informations, consultez la section AWS Tags in AWS Glue.	20 mars 2019
Prise en charge du catalogue de données pour les tâches Spark SQL	Ajout d'informations sur la configuration de vos AWS Glue tâches et de vos points de terminaison de développement pour les utiliser AWS Glue Data Catalog en tant que métastore Apache Hive externe. Ceci permet aux tâches et points de terminaison de développement d'exécuter directement des requêtes Apache Spark SQL sur les tables stockées dans le catalogue de données AWS Glue Data Catalog. Pour plus d'informations, consultez Prise en charge de AWS Glue Data Catalog des tâches Spark SQL.	14 mars 2019
Prise en charge des tâches shell Python	Ajout d'informations sur les tâches shell Python et le nouveau champ Maximum capacity (Capacité maximum). Pour en savoir plus, consultez Ajout de tâches shell Python dans AWS Glue.	18 janvier 2019
Prise en charge des notifications en cas de modification des base de données et des tableaux	Ajout d'informations sur les événements qui sont générés en cas de modification au niveau des appels d'API des bases de données, tables et partitions. Vous pouvez configurer des actions dans CloudWatch Events pour répondre à ces événements. Pour plus d'informations, consultez Automatisation à l' AWS Glue aide d' CloudWatch événements.	16 janvier 2019
Prise en charge du chiffrage de mots de passe de connexion	Ajout d'informations concernant le chiffrement de mots de passe utilisés dans les objets de connexion. Pour plus d'informations, consultez Chiffrement des mots de passe de connexion.	11 décembre 2018
Prise en charge des autorisations au niveau des ressources et des politiques basées sur les ressources	Ajout d'informations sur l'utilisation des autorisations au niveau des ressources et des politiques basées sur les ressources avec. AWS Glue Pour plus d'informations, consultez les rubriques répertoriées dans Sécurité dans AWS Glue.	15 octobre 2018
Support pour ordinateurs portables dotés d' SageMaker intelligence artificielle	Ajout d'informations sur l'utilisation de blocs-notes SageMaker IA avec des terminaux AWS Glue de développement. Pour plus d'informations, consultez Gestion des blocs-notes.	5 octobre 2018
Prise en charge du chiffrement	Ajout d'informations sur l'utilisation du chiffrement avec AWS Glue. Pour de plus amples informations, veuillez consulter Chiffrement au repos, Chiffrement en transit et Configuration du chiffrement dans AWS Glue.	24 août 2018
Prise en charge des métriques de tâches Apache Spark	Informations supplémentaires sur l'utilisation des métriques Apache Spark pour un meilleur débogage et un meilleur profilage des tâches ETL. Vous pouvez facilement suivre les indicateurs d'exécution tels que les octets lus et écrits, l'utilisation de la mémoire et la charge du processeur du pilote et des exécuteurs, ainsi que les transferts de données entre les exécuteurs depuis la console. AWS Glue Pour plus d'informations, consultez les sections Surveillance AWS Glue à l'aide de CloudWatch métriques, Surveillance et débogage des tâches, et Utilisation des tâches sur la AWS Glue console.	13 juillet 2018
Prise en charge de DynamoDB en tant que source de données	Informations supplémentaires sur l'indexation de DynamoDB et sur son utilisation en tant que source de données de tâches ETL. Pour plus d'informations, consultez Catalogage de tables avec un crawler et Paramètres de connexion.	10 juillet 2018
Mises à jour pour créer une procédure de serveur de bloc-notes	Informations mises à jour sur la création d'un serveur de blocs-notes sur une EC2 instance Amazon associée à un point de terminaison de développement. Pour plus d'informations, consultez Création d'un serveur de bloc-notes associé à un point de terminaison de développement.	9 juillet 2018
Mises à jour disponibles sur RSS	Vous pouvez à présent vous abonner à un flux RSS pour recevoir les notifications des mises à jour du Guide du développeur AWS Glue .	25 juin 2018
Prise en charge des notifications de délai d'attente pour les tâches	Ajout d'informations sur la configuration d'un seuil de délai d'attente lorsqu'une tâche est exécutée. Pour plus d’informations, consultez Ajout de tâches dans AWS Glue.	25 mai 2018
Configuration d'un crawler pour ajouter de nouvelles colonnes	Ajout d'informations sur la nouvelle option de configuration pour les robots d'exploration, MergeNewColumns. Pour plus d'informations, consultez Configuration d'un crawler.	7 mai 2018
Prise en charge du délai d'expiration des tâches	Ajout d'informations sur la définition d'un seuil de délai d'expiration lorsqu'une tâche est exécutée. Pour plus d’informations, consultez Ajout de tâches dans AWS Glue.	10 avril 2018
Prise en charge du script ETL Scala et déclenchement des tâches en fonction des statuts d'exécution	Informations supplémentaires sur l'utilisation de Scala comme langage de programmation ETL. De plus, l'API de déclenchement prend désormais en charge le déclenchement lorsque l'une des conditions est remplie (en plus de toutes les conditions). En outre, les tâches peuvent être déclenchées en fonction de l'« échec » ou de l'« arrêt » d'une tâche exécutée (en plus d'une exécution de tâche « réussie »).	12 janvier 2018

Mises à jour antérieures

Le tableau ci-après décrit les modifications importantes apportées dans chaque version du Manuel du développeur AWS Glue avant janvier 2018.

Modification	Description	Date
Prise en charge des sources de données XML et nouvelle option de configuration du crawler	Ajout d'informations sur la classification des sources de données XML et nouvelle option crawler pour les modifications de partition.	16 novembre 2017
Prise en charge de nouvelles transformations pour les moteurs de base de données Amazon RDS supplémentaires et améliorations des points de terminaison de développement	Ajout d'informations sur les transformations de filtrage et de mappage, prise en charge de Microsoft SQL Server sur Amazon RDS et Oracle sur Amazon RDS, et nouvelles fonctions pour les points de terminaison de développement.	29 septembre 2017
AWS Glue publication initiale	Il s'agit de la première version du Guide du développeur AWS Glue .	14 août 2017

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Problèmes connus

AWS Glossaire