Cronologia della documentazione per AWS Glue - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Cronologia della documentazione per AWS Glue

ModificaDescrizioneData

Il rilevamento delle anomalie e le regole dinamiche sono ora disponibili a livello generale

AWS Glue Data Quality utilizza un algoritmo di apprendimento automatico per apprendere dalle tendenze passate e quindi prevedere i valori futuri per rilevare le anomalie. Dynamic Rules consente di fornire soglie dinamiche. Per ulteriori informazioni, vedere Ottimizzazione delle prestazioni delle query per le tabelle Iceberg.

7 agosto 2024

La generazione di statistiche sulle colonne per le tabelle Iceberg è ora disponibile a tutti

AWS Glue supporta il calcolo e l'aggiornamento del numero di valori distinti (NDVs) per ogni colonna nelle tabelle Iceberg. Per ulteriori informazioni, consulta Rilevamento delle anomalie nelle regole dinamiche e di qualità AWS Glue dei dati.

9 luglio 2024

Support per i profili AWS Glue di utilizzo

Gli amministratori possono creare profili di AWS Glue utilizzo per varie classi di utenti all'interno dell'account, come sviluppatori, tester e team di prodotto. Questa flessibilità consente agli amministratori di applicare controlli di utilizzo e costi diversi per ogni classe di utenti. Per ulteriori informazioni, vedere Configurazione dei profili AWS Glue di utilizzo.

18 giugno 2024

Support per un connettore Salesforce per AWS Glue Spark

Sono state aggiunte informazioni su un nuovo AWS Glue connettore per Salesforce. Questa funzionalità consente di utilizzare Spark AWS Glue per leggere e scrivere su Salesforce nella AWS Glue versione 4.0 e successive. Per ulteriori informazioni, consulta Connessione a Salesforce.

22 maggio 2024

Integrazione dei dati di Amazon Q in AWS Glue (GA)

L'integrazione dei dati di Amazon Q AWS Glue è una nuova funzionalità di intelligenza artificiale generativa AWS Glue che consente ai data engineer e ETL agli sviluppatori di creare lavori di integrazione dei dati utilizzando il linguaggio naturale. Gli ingegneri e gli sviluppatori possono chiedere a Q di creare lavori, risolvere problemi e rispondere a domande sull' AWS Glue integrazione dei dati. Per ulteriori informazioni, consulta Integrazione dei dati di Amazon Q in AWS Glue. Questa funzionalità include un aggiornamento e una AwsGlueSessionUserRestrictedServiceRole AWS gestione delle AwsGlueSessionUserRestrictedPolicy politiche. AwsGlueSessionUserRestrictedNotebookServiceRole Per ulteriori informazioni, consulta AWS Glue Aggiornamenti alle politiche AWS gestite.

30 aprile 2024

Integrazione dei dati di Amazon Q in AWS Glue (anteprima)

L'integrazione dei dati di Amazon Q AWS Glue è una nuova funzionalità di intelligenza artificiale generativa AWS Glue che consente ai data engineer e ETL agli sviluppatori di creare lavori di integrazione dei dati utilizzando il linguaggio naturale. Gli ingegneri e gli sviluppatori possono chiedere a Q di creare lavori, risolvere problemi e rispondere a domande sull' AWS Glue integrazione dei dati. Per ulteriori informazioni, consulta Integrazione dei dati di Amazon Q in AWS Glue. Questa funzionalità include un aggiornamento della politica AwsGlueSessionUserRestrictedNotebookPolicy AWS gestita. Per ulteriori informazioni, consulta AWS Glue gli aggiornamenti delle politiche AWS gestite.

30 gennaio 2024

Aggiornamento della documentazione per AWS Glue lo streaming

Aggiunto un nuovo capitolo con contenuti nuovi e riorganizzati per AWS Glue lo streaming. Questo contenuto descrive come funziona lo streaming AWS Glue, le caratteristiche dell'elaborazione dei dati in tempo reale e come monitorare i processi di streaming. Per ulteriori informazioni, consulta la pagina AWS Glue Streaming.

27 dicembre 2023

Supporto per l'utilizzo del rilevamento dei dati sensibili granulari

La trasformazione relativa al rilevamento dei dati sensibili fornisce la possibilità di rilevare, mascherare o rimuovere le entità che hai definito o che sono predefinite da AWS Glue. Le azioni granulari consentono inoltre di applicare un'azione specifica per entità. Per ulteriori informazioni, consulta Utilizzo del rilevamento dei dati sensibili granulari.

26 novembre 2023

Support per il monitoraggio dei lavori con metriche AWS Glue di Observability

Utilizza i parametri AWS Glue di osservabilità per generare approfondimenti su ciò che accade all'interno di AWS Glue per i processi di Apache Spark e migliorare la classificazione e l'analisi dei problemi. Per ulteriori informazioni, consulta Monitoraggio con parametri AWS Glue di osservabilità.

26 novembre 2023

Support per il rilevamento delle anomalie in AWS Glue Data Quality

Il rilevamento delle anomalie relative a Qualità dei dati di AWS Glue applica nel tempo algoritmi di machine learning (ML) alle statistiche sui dati per rilevare modelli anomali e problemi nascosti di qualità dei dati che sono difficili da individuare attraverso le regole. Per ulteriori informazioni, consulta Rilevamento delle anomalie in Qualità dei dati di AWS Glue.

26 novembre 2023

Aggiornamento al comportamento di registrazione predefinito dell'interfaccia utente di Spark

I job Spark che generano i log dell'interfaccia utente di Spark ora verranno scritti con un modello di nome file diverso per supportare l'interfaccia utente Spark nella console. AWS Glue Ciò non modifica il comportamento dei log. CloudWatch È possibile ripristinare il comportamento legacy aggiornando la configurazione del processo. Per ulteriori informazioni, consulta Monitoraggio dei processi tramite l'interfaccia utente Web di Apache Spark.

17 novembre 2023

Support per nuove fonti di dati in AWS Glue for Spark

Le connessioni ad Amazon OpenSearch Service, AzureSQL, Azure Cosmos for NoSQL, SAP HANA Teradata Vantage e Vertica sono ora supportate nativamente all'interno. AWS Glue Inoltre, le connessioni a queste fonti di dati, oltre a MongoDB, sono ora disponibili per l'uso nell' AWS Glue editor visivo di Studio. Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue for Spark AWS Glue per informazioni sul supporto di Spark e Aggiungere una AWS Glue connessione per informazioni sull'uso nell' AWS Glue editor visivo di Studio.

17 novembre 2023

Supporto per generare le statistiche delle colonne

Puoi calcolare statistiche a livello di colonna per AWS Glue Data Catalog tabelle in formati di dati come Parquet,,, ORC JSON IONCSV, e XML senza configurare pipeline di dati aggiuntive. Per ulteriori informazioni, consulta Utilizzo delle statistiche delle colonne.

16 novembre 2023

Supporto per la compattazione dei dati per le tabelle Iceberg

Per migliorare le prestazioni di lettura da parte di servizi di AWS analisi come Amazon Athena e Amazon e AWS Glue ETL jobEMR, Data Catalog offre la compattazione gestita (un processo che compatta piccoli oggetti Amazon S3 in oggetti più grandi) per le tabelle Iceberg in Data Catalog. Per ulteriori informazioni, consulta Ottimizzazione delle tabelle Iceberg.

13 novembre 2023

Aggiornamento al comportamento di attesa dell'esecuzione del processo

Le esecuzioni del processo standard di shell (interprete di comandi) Spark e Python ora passeranno a WAITING in determinate situazioni, anziché passare immediatamente a FAILED. Per ulteriori informazioni, consulta Stati di esecuzione dei processi AWS Glue.

8 novembre 2023

Guida per l'utente AWS Glue Studio consolidata nella guida per sviluppatori AWS Glue

La guida per l'utente AWS Glue Studio è stata spostata nella guida per sviluppatori per creare un'unica guida utente completa per AWS Glue Studio, la console AWS Glue e l'accesso a AWS Glue Studio a livello di programmazione.

25 ottobre 2023

Aggiornamento della policy gestita AWSGlueServiceNotebookRole AWS

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueServiceNotebookRole AWS gestita. Per ulteriori informazioni, consulta AWS GlueAggiornamenti alle politiche AWS gestite.

9 ottobre 2023

AWS Glue Studio supporta cinque nuove trasformazioni integrate

AWS Glue Studiosupporta le seguenti cinque nuove trasformazioni integrate: Record matching, Remove null rows, Parse JSON column, Extract JSON path e Regex extractor. Per ulteriori informazioni, consulta Modifica AWS Glue dei nodi di trasformazione dei dati gestiti.

11 agosto 2023

Aggiornamento della politica AWSGlueServiceRole AWS gestita

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueServiceRole AWS gestita. Per ulteriori informazioni, consulta AWS GlueAggiornamenti alle politiche AWS gestite.

4 agosto 2023

Supporto per il crawling delle tabelle Apache Hudi

Sono state aggiunte informazioni sull'utilizzo AWS Glue per eseguire la scansione delle tabelle Hudi nei bucket Amazon S3 e sulla registrazione delle tabelle Hudi in. AWS Glue Data Catalog Per ulteriori informazioni, consulta le pagine Which data stores can I crawl? e Crawler properties.

21 luglio 2023

Aggiornamento della politica gestita AWSGlueConsoleFullAccess AWS

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS GlueAggiornamenti alle politiche AWS gestite.

14 luglio 2023

Supporto per il crawling delle tabelle Apache Iceberg

Sono state aggiunte informazioni sull'utilizzo AWS Glue per eseguire la scansione delle tabelle Iceberg nei bucket Amazon S3 e sulla registrazione delle tabelle Iceberg in. AWS Glue Data Catalog Per ulteriori informazioni, consulta le pagine Which data stores can I crawl? e Crawler properties.

7 luglio 2023

Support per AWS Glue with Ray

Sono state aggiunte informazioni su AWS Glue with Ray, un nuovo motore in grado di supportare i AWS Glue lavori. Riorganizzato il contenuto esistente AWS Glue con Spark per chiarire le ambiguità.

30 maggio 2023

Support per la qualità AWS Glue dei dati (GA)

AWS Glue La qualità dei dati è ora disponibile a livello generale. AWS Glue Data Quality ti aiuta a valutare e monitorare la qualità dei tuoi dati. Per informazioni su come utilizzare AWS Glue Data Quality con Data Catalog, consulta AWS Glue Data Quality. Per ulteriori informazioni sulla qualità AWS Glue dei dati per AWS Glue Studio, consulta Valutazione della qualità dei dati con AWS Glue Studio.

24 maggio 2023

Supporto per tipi di worker di grandi dimensioni per i processi Apache Spark

È ora disponibile il supporto per l'uso dei tipi di worker G.4X e G.8X per i processi Apache Spark. Questi tipi di worker sono adatti per i processi i cui carichi di lavoro contengono trasformazioni, aggregazioni, join e query con i maggiori requisiti. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

8 maggio 2023

Supporto per la creazione di indici di partizione durante il crawling delle tabelle

Sono state aggiunte informazioni sul modo in cui i crawler supportano la creazione di indici di partizione per le tabelle rilevate dal crawler. Per ulteriori informazioni, consulta la pagina Setting the partition index crawler configuration option.

24 aprile 2023

Supporto per i parametri di utilizzo delle risorse

Sono state aggiunte informazioni sulla visualizzazione dell'utilizzo delle risorse del servizio e sulla configurazione degli allarmi in Amazon. CloudWatch Per ulteriori informazioni, consulta la pagina AWS Glue resource monitoring.

7 aprile 2023

Aggiornamento della politica gestita AWSGlueConsoleFullAccess AWS

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS GlueAggiornamenti alle politiche AWS gestite.

28 marzo 2023

Sono state aggiunte linee guida per l'utilizzo AWS Glue con e AWS SDK con esempi

La Guida per gli AWS Glue sviluppatori contiene due nuove sezioni che forniscono informazioni utili per l'utilizzo AWS Glue con un AWS SDK. Per ulteriori informazioni, consulta AWS Glue Using with an AWS SDK e Code examples for AWS Glue using AWS SDKs.

23 febbraio 2023

Aggiornamento della documentazione per IAM with AWS Glue

Informazioni riorganizzate e aggiunte sull'utilizzo IAM con AWS Glue. Per ulteriori informazioni, consulta Identity and Access Management per AWS Glue.

15 febbraio 2023

Support per l'esecuzione ETL di processi di streaming nella AWS Glue versione 4.0

Sono state aggiunte informazioni sul supporto per l'esecuzione di ETL lavori di streaming nella versione 4.0 di Glue e nuove opzioni per la connessione a un cluster Kafka o a un cluster Amazon Managed Streaming for Apache Kafka e Amazon Kinesis Data Streams. Per ulteriori informazioni, consulta Aggiungere ETL lavori di streaming in e Tipi AWS Glue e opzioni di connessione per in. ETL AWS Glue

8 febbraio 2023

Supporto per il crawling delle origini dati MongoDB Atlas

Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle fonti di dati MongoDB Atlas. Per ulteriori informazioni, consulta Quali archivi di dati posso scansionare? , proprietà di connessione MongoDB e MongoDB Atlas e Utilizzo di una connessione MongoDB o MongoDB Atlas.

6 febbraio 2023

Supporto per il crawling delle tabelle Delta Lake con un connettore Delta Lake nativo

Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle tabelle Delta Lake utilizzando un connettore Delta Lake nativo. Questa funzionalità ti consente di utilizzare i motori di AWS query per interrogare direttamente il registro delle transazioni Delta e utilizzare funzionalità come viaggi nel tempo e ACID garanzie, e di sincronizzare i metadati Delta Lake dai file di transazione di Amazon S3 nel Data Catalog per abilitare le autorizzazioni alle colonne sulle tue query in Lake Formation. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio di dati Delta Lake e Interrogazione delle tabelle Delta Lake.

15 dicembre 2022

Support for AWS Glue Data Quality (anteprima)

Il supporto è ora disponibile per AWS Glue Data Quality (anteprima). AWS Glue Data Quality consente di valutare e monitorare la qualità dei dati quando si utilizza la AWS Glue versione 3.0. Per informazioni su come utilizzare AWS Glue Data Quality con Data Catalog, vedi AWS Glue Data Quality (anteprima). Per ulteriori informazioni sulla qualità AWS Glue dei dati per AWS Glue Studio, consulta Valutazione della qualità dei dati con AWS Glue Studio.

30 novembre 2022

Supporto per un nuovo connettore Amazon Redshift Spark con nuove funzionalità e miglioramenti delle prestazioni

È ora disponibile il supporto per un nuovo connettore Amazon Redshift Spark con un nuovo JDBC driver da utilizzare con i AWS Glue ETL processi di creazione di applicazioni Apache Spark che leggono e scrivono su dati in Amazon Redshift come parte delle pipeline di acquisizione e trasformazione dei dati. Per ulteriori informazioni, consulta Spostamento di dati da e verso Amazon Redshift.

29 novembre 2022

Supporto per AWS Glue versione 4.0.

Aggiunte informazioni sul supporto per AWS Glue 4.0. Le funzionalità includono il supporto nativo per i framework data lake aperti con Apache Hudi, Delta Lake e Apache Iceberg e il supporto nativo per il plug-in di archiviazione cloud shuffle basato su Amazon S3 (un plug-in Apache Spark) per utilizzare Amazon S3 per la capacità di archiviazione shuffle ed elastica. Per ulteriori informazioni, consulta Note di rilascio di AWS Glue e Migrazione dei processi AWS Glue a AWS Glue versione 4.0.

28 novembre 2022

AWS Glue Studio ora offre trasformazioni visive personalizzate

Le trasformazioni visive personalizzate consentono ai clienti di definire, riutilizzare e condividere la logica specifica dell'azienda tra i propri team. ETL Per ulteriori informazioni, consulta Trasformazioni visive personalizzate.

28 novembre 2022

Support per l'utilizzo del AWS Glue crawler per pubblicare metadati per gli archivi dati JDBC

È ora disponibile il supporto per l'utilizzo del AWS Glue crawler per pubblicare metadati come commenti e tipi grezzi nel Data Catalog per gli archivi di dati. JDBC Per ulteriori informazioni, consulta Parametri impostati nelle tabelle del Catalogo dati dal crawler, Proprietà del crawler e struttura. JdbcTarget

18 novembre 2022

Supporto per il crawling di datastore Snowflake

È ora disponibile il supporto per l'utilizzo di AWS Glue per eseguire il crawling delle tabelle e delle viste Snowflake e per pubblicare i metadati nel catalogo di dati come voce della tabella. Per le tabelle esterne Snowflake in Amazon S3, il crawler esegue il crawling anche della posizione Amazon S3 e del tipo di formato di file della tabella esterna e lo compila come parametri della tabella. Per ulteriori informazioni, consulta Quali datastore posso sottoporre a crawling?, Proprietà della connessione a AWS Glue e Parametri impostati nelle tabelle del catalogo di dati dal crawler.

18 novembre 2022

Supporto per una migliore gestione dello shuffle delle applicazioni Spark

È ora disponibile il supporto per un nuovo plug-in di archiviazione cloud shuffle per Apache Spark. Per ulteriori informazioni, consulta Plug-in shuffle di AWS Glue Spark con Amazon S3 e Plug-in di archiviazione cloud shuffle per Apache Spark.

15 novembre 2022

È stato aggiunto il supporto per le destinazioni catalogo dati quando si accelerano le notifiche di evento Amazon S3 del crawling

Oltre al supporto esistente per le destinazioni Amazon S3, ora è disponibile il supporto per accelerare il crawling per le destinazioni catalogo dati tramite notifiche di eventi Amazon S3. Per ulteriori informazioni, consulta Accelerazione del crawling usando le notifiche eventi di Amazon S3.

13 ottobre 2022

Supporto per specificare il numero massimo di tabelle che un crawler può creare

È ora disponibile il supporto per specificare il numero massimo di tabelle che il crawler può creare. Per ulteriori informazioni, consulta la pagina Come specificare il numero massimo di tabelle che il crawler può creare.

6 settembre 2022

Supporto per Python 3.9 in processi della shell Python in AWS Glue

È ora disponibile il supporto per l'esecuzione di script compatibili con Python 3.9 nei processi della shell (interprete di comandi) Python in AWS Glue e per la scelta dell'uso di set di librerie preconfezionati. Per ulteriori informazioni, consulta Processi della shell Python in AWS Glue.

11 agosto 2022

Support per l'esecuzione di AWS Glue lavori non urgenti o non urgenti utilizzando capacità inutilizzata

È ora disponibile il supporto per la configurazione di esecuzioni flessibili per processi non urgenti come processi di pre-produzione, test e caricamenti di dati una tantum. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

9 agosto 2022

Il supporto per un nuovo tipo di worker per i processi di streaming

Il supporto di questo servizio di Support per l'uso del tipo di worker G.025X per processi di streaming a basso volume. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

14 luglio 2022

Support per l'uso di Kafka SASL nelle connessioni AWS Glue

Il supporto è ora disponibile per l'uso di Kafka SASL nelle AWS Glue connessioni. Per ulteriori informazioni, consulta AWS Glue Proprietà di connessione Kafka per l'autenticazione client.

5 luglio 2022

Supporto per il connettore Apache Kafka per gli schemi protobuf

Il supporto di Apache Kafka Connector è attualmente disponibile per gli schemi Protobuf. Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

9 giugno 2022

Supporto per Auto Scaling per processi AWS Glue (GA)

Informazioni aggiuntive sull'utilizzo di Auto Scaling per i processi in AWS Glue versione 3.0 per scalare dinamicamente le risorse di calcolo. Per ulteriori informazioni, consulta Utilizzo di Auto Scaling per AWS Glue.

14 aprile 2022

Aggiornamento della documentazione per lo sviluppo di AWS Glue e i test di script di processo di AWS Glue

Informazioni riorganizzate e aggiunte sui metodi di sviluppo e test disponibili per AWS Glue, incluse le istruzioni per lo sviluppo con Docker. Per ulteriori informazioni, consulta Sviluppo e test di script di processo di AWS Glue.

14 marzo 2022

Aggiunta di buffer del protocollo (protobuf) come formato di dati supportato per il registro degli schemi di AWS Glue

Sono state aggiunte informazioni su Protobuf come formato di dati supportato (oltre a e). AVRO JSON Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

25 febbraio 2022

Supporto per il crawling delle tabelle Delta Lake

Sono state aggiunte informazioni sull'utilizzo AWS Glue per la scansione delle tabelle Delta Lake. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio dati Delta Lake.

24 febbraio 2022

Support per approfondimenti sul AWS Glue lavoro

Sono state aggiunte informazioni sull'utilizzo di AWS Glue Job Insights per semplificare il debug e l'ottimizzazione dei job. AWS Glue Per ulteriori informazioni, consulta Monitoraggio tramite le informazioni sui processi di AWS Glue.

8 febbraio 2022

Supporto per la scansione di tabelle Data Catalog basate su Amazon S3 utilizzando un endpoint VPC

Oltre agli archivi dati di Amazon S3, puoi configurare le tabelle del catalogo dati basate su Amazon S3 in modo che siano accessibili solo da un ambiente Amazon Virtual Private Cloud (VPCAmazon), per scopi di sicurezza, audit o controllo. Per ulteriori informazioni, consulta Scansione di tabelle del catalogo dati basate su Amazon S3 o Amazon S3 Data Store utilizzando un endpoint. VPC

3 febbraio 2022

Supporto per le tavole governate dalla Lake Formation

Sono state aggiunte informazioni sul AWS Glue supporto per le tabelle governate da Lake Formation, che supportano ACID transazioni, compattazione automatica dei dati e query sui viaggi nel tempo. Per ulteriori informazioni, consulta la guida per AWS GlueAPIgli AWS Lake Formation sviluppatori.

30 novembre 2021

Nuove politiche AWS gestite aggiunte per sessioni e notebook interattivi

Nuove politiche gestite per IAM fornire una maggiore sicurezza per l'utilizzo AWS Glue con sessioni e notebook interattivi. Per ulteriori informazioni, consulta la sezione Policy gestite da AWS per AWS Glue.

30 novembre 2021

Il registro dello schema Glue ora supportato con i processi di streaming

È possibile creare processi di streaming che accedono alle tabelle che fanno parte di Glue Schema Registry. Per ulteriori informazioni, consulta AWS Glue Schema Registry e Adding Streaming Jobs in ETL. AWS Glue

15 novembre 2021

Supporto per nuove caratteristiche di machine learning

Aggiunte informazioni sulle nuove funzionalità per la trasformazione di machine learning Ricerca corrispondenze, tra cui la corrispondenza incrementale e il punteggio di corrispondenza. Per ulteriori informazioni, consulta Ricerca di corrispondenze incrementali e Stima della qualità delle corrispondenze utilizzando i punteggi di confidenza delle corrispondenze.

31 ottobre 2021

(Anteprima privata) Supporto per processi flessibili di AWS Glue

Aggiunte informazioni sulla configurazione dei processi AWS Glue Spark con una classe di esecuzione flessibile, appropriata per i processi non sensibili al tempo i cui tempi di inizio e completamento possono variare. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

29 ottobre 2021

Supporto per accelerare il crawling usando le notifiche eventi di Amazon S3

Sono state aggiunte informazioni sull'accelerazione del crawling usando le notifiche eventi di Amazon S3. Per ulteriori informazioni, consulta Accelerazione del crawling usando le notifiche eventi di Amazon S3.

15 ottobre 2021

Opzioni di configurazione di sicurezza aggiuntive relative al controllo degli accessi e VPCs

Sono state aggiunte informazioni su come configurare nuove autorizzazioni di controllo degli accessi AWS Glue e sulla configurazione di. VPCs Per ulteriori informazioni, consulta AWSTags in AWS Glue, Politiche basate sull'identità (IAMpolitiche) che controllano le impostazioni utilizzando chiavi di condizione o chiavi contestuali e Configurazione di tutte le AWS chiamate da effettuare. VPC

13 ottobre 2021

Support per le policy VPC degli endpoint

Sono state aggiunte informazioni sul supporto per le policy degli endpoint Virtual Private Cloud (VPC) in. AWS Glue Per ulteriori informazioni, vedere AWS Glueand interface VPC endpoints ()AWS PrivateLink.

11 ottobre 2021

Glue Studio è ora disponibile in Cina

AWS Glue Studio è ora disponibile nelle Regioni cinesi di Pechino e Ningxia.

11 ottobre 2021

AWS Glue Studio offre la creazione di notebook per la modifica interattiva dei processi

I notebook consentono di scrivere ed eseguire codice, visualizzare i risultati e condividere informazioni. In genere, i data scientist utilizzano i notebook per esperimenti e attività di esplorazione dei dati. Per ulteriori informazioni, consulta Utilizzo di notebook.

1° ottobre 2021

L'accesso diretto alle fonti di streaming ora disponibile

Quando aggiungi fonti di dati al tuo ETL lavoro nell'editor visivo, puoi fornire informazioni per accedere al flusso di dati invece di dover utilizzare un database e una tabella del Data Catalog.

30 settembre 2021

Documentata la policy di supporto versione AWS Glue

Aggiunte informazioni sulla policy di supporto versione AWS Glue e sulle fasi di fine vita per alcune versioni AWS Glue. Per ulteriori informazioni, consulta Policy di supporto versione AWS Glue.

24 settembre 2021

I connettori personalizzati possono ora essere utilizzati con le anteprime dei dati

Quando modifichi il nodo dell'origine dati utilizzando un connettore personalizzato, puoi visualizzare in anteprima il set di dati scegliendo la scheda Anteprima dati. Per ulteriori informazioni, consulta Connettori personalizzati.

24 settembre 2021

Support per sessioni AWS Glue interattive (anteprima privata)

(Anteprima privata) Sono state aggiunte informazioni sull'utilizzo di sessioni AWS Glue interattive per eseguire carichi di lavoro Spark nel cloud da qualsiasi notebook Jupyter. Le sessioni interattive sono il metodo preferito per sviluppare il codice AWS Glue extract, transform e load (ETL) quando si utilizza la versione 2.0 o successiva. AWS Glue Per ulteriori informazioni, vedete Configurazione ed esecuzione di sessioni AWS Glue interattive per Jupyter Notebook.

24 agosto 2021

Supporto per la creazione di flussi di lavoro dai progetti (GA)

Sono state aggiunte informazioni sulla codifica dei casi d'uso comuni di estrazione, trasformazione e load (ETL) nei blueprint e sulla successiva creazione di flussi di lavoro a partire dai blueprint. Consente agli analisti di dati di creare ed eseguire facilmente processi complessi. ETL Per ulteriori informazioni, consulta Esecuzione di ETL attività complesse utilizzando blueprint e flussi di lavoro in. AWS Glue

23 agosto 2021

Supporto per AWS Glue versione 3.0.

Sono state aggiunte informazioni sul supporto per la AWS Glue versione 3.0 che supporta l'aggiornamento del motore Apache Spark 3.0 per l'esecuzione dei ETL job Apache Spark e altre ottimizzazioni e aggiornamenti. Per ulteriori informazioni, consulta Note di rilascio di AWS Glue e Migrating AWS Glue jobs to AWS Glue version 3.0. Altre funzionalità di questa versione includono lo AWS Glue shuffle manager, un SIMD lettore vettoriale e i predicati delle partizioni del catalogo. CSV Per ulteriori informazioni, consulta AWS GlueSpark shuffle manager con Amazon S3, Opzioni di formato per ETL ingressi e uscite e Filtraggio lato server utilizzando i predicati delle partizioni del AWS Glue catalogo.

18 agosto 2021

AWS GovCloud (US) Region

AWS Glue Studioè ora disponibile in AWS GovCloud (US) Region

18 agosto 2021

Creazione di shell Python disponibile in AWS Glue Studio

Quando si crea un nuovo processo, è ora possibile scegliere di creare un processo di shell Python. Per ulteriori informazioni, consulta Avvio della creazione del processo e Modifica di processi shell Python in AWS Glue Studio.

13 agosto 2021

Support per l'avvio di un flusso di lavoro con un EventBridge evento Amazon

Aggiunte informazioni su come AWS Glue può essere un consumatore di eventi in un'architettura basata su eventi. Per ulteriori informazioni, consulta Avvio di un AWS Glue flusso di lavoro con un EventBridge evento Amazon e Visualizzazione degli EventBridge eventi che hanno avviato un flusso di lavoro.

14 luglio 2021

Aggiunta JSON come formato di dati supportato per il registro degli AWS Glue schemi

Sono state aggiunte informazioni su JSON come formato di dati supportato (oltre aAVRO). Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

30 giugno 2021

Creare processi di streaming AWS Glue senza una tabella del catalogo dati

La funzione create_data_frame_from_optionsPython o gli script getSourceper Scala supportano la creazione di ETL lavori di streaming che fanno riferimento direttamente ai flussi di dati invece di richiedere una tabella Data Catalog.

15 giugno 2021

AWS Gluele trasformazioni di apprendimento automatico ora supportano le chiavi AWS Key Management Service

È possibile specificare una configurazione o una AWS KMS chiave di sicurezza quando si configurano le trasformazioni di AWS Glue Machine Learning con la console, ilCLI, o il. AWS Glue APIs Per ulteriori informazioni, vedere Utilizzo della crittografia dei dati con Machine Learning Transforms e AWS GlueMachine Learning API.

15 giugno 2021

Aggiornamento della politica AWSGlueConsoleFullAccess AWS gestita

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta AWS GlueAggiornamenti alle politiche AWS gestite.

10 giugno 2021

Visualizzare il set di dati del processo durante la creazione e la modifica dei processi

È possibile utilizzare la nuova scheda di anteprima dati per un nodo nel diagramma del processo per visualizzare un esempio dei dati elaborati da tale nodo. Per ulteriori informazioni, consulta Utilizzo delle anteprime dei dati nell'editor visivo dei processi.

7 giugno 2021

Supporto per specificare un valore che indica la posizione della tabella per l'output del crawler.

Sono state aggiunte informazioni su come specificare un valore che indica la posizione della tabella durante la configurazione dell'output del crawler. Per ulteriori informazioni, consulta Come specificare la posizione della tabella.

4 giugno 2021

Supporto per il crawling di un campione di file in un set di dati durante il crawling di un archivio dati Amazon S3

Sono state aggiunte informazioni su come eseguire il crawling di un campione di file durante il crawling di Amazon S3. Per ulteriori informazioni, consulta Proprietà del crawler.

10 maggio 2021

Supporto per il AWS Glue writer parquet ottimizzato

Sono state aggiunte informazioni sull'utilizzo del parquet writer AWS Glue ottimizzato DynamicFrames per creare o aggiornare tabelle con la parquet classificazione. Per ulteriori informazioni, consultate Creazione di tabelle, aggiornamento dello schema e aggiunta di nuove partizioni nel catalogo dati da AWS Glue ETL Jobs e Opzioni di formato per ETL input e output in. AWS Glue

4 maggio 2021

Supporto per le password di autenticazione client Kafka

Sono state aggiunte informazioni su come i ETL job di streaming AWS Glue supportano l'autenticazione dei certificati SSL client con i produttori di stream Apache Kafka. È ora possibile fornire un certificato personalizzato durante la definizione di una connessione AWS Glue a un cluster Apache Kafka, che AWS Glue utilizzerà durante l'autenticazione con esso. Per ulteriori informazioni, vedere AWS GlueConnection Properties e Connection. API

28 Aprile 2021

Supporto per il consumo di dati da Amazon Kinesis Data Streams in un altro account nei lavori di streaming ETL

Sono state aggiunte informazioni sulla creazione di un ETL processo di streaming per utilizzare i dati di Amazon Kinesis Data Streams in un altro account. Per ulteriori informazioni, consulta Aggiungere ETL lavori di streaming in. AWS Glue

30 marzo 2021

SQLtrasformazione disponibile

È possibile utilizzare un nodo di SQLtrasformazione per scrivere la propria trasformazione sotto forma di SQL query. Per ulteriori informazioni, vedere Utilizzo di una SQL query per trasformare i dati.

23 marzo 2021

Supporto per la creazione di flussi di lavoro dagli schemi (anteprima pubblica)

(Anteprima pubblica) Sono state aggiunte informazioni sulla codifica dei casi d'uso comuni di estrazione, trasformazione e caricamento (ETL) nei blueprint e sulla successiva creazione di flussi di lavoro a partire dai blueprint. Consente agli analisti di dati di creare ed eseguire facilmente processi complessi. ETL Per ulteriori informazioni, consulta Esecuzione di ETL attività complesse utilizzando blueprint e flussi di lavoro in. AWS Glue

22 marzo 2021

I connettori possono essere utilizzati per le destinazioni dati

Ora è supportato l'utilizzo di un Marketplace AWS connettore o di un connettore personalizzato per la destinazione dei dati. Per ulteriori informazioni, consulta Creazione di processi con connettori personalizzati.

15 marzo 2021

Supporto per i parametri sull'importanza delle colonne per le trasformazioni di machine learning AWS Glue

Aggiunte informazioni sulla visualizzazione delle metriche relative all'importanza delle colonne quando si lavora con le trasformazioni basate su machine learning AWS Glue. Per ulteriori informazioni, consulta Operare con le trasformazioni basate su machine learning nella console di AWS Glue

5 febbraio 2021

La pianificazione dei processi è ora disponibile in AWS Glue Studio

È possibile definire una pianificazione basata sul tempo per le esecuzioni del processo in AWS Glue Studio. È possibile utilizzare la console per creare una pianificazione di base o definire una pianificazione più complessa utilizzando la sintassi cron di tipo Unix. Per ulteriori informazioni, consulta Pianificazione delle esecuzioni.

21 dicembre 2020

Rilascio di AWS Glue Custom Connectors

AWS Glue Custom Connectors ti consente di scoprire e sottoscrivere i connettori in Marketplace AWS. Abbiamo anche rilasciato le interfacce di runtime AWS Glue Spark per collegare connettori creati per Apache Spark Datasource, Athena federated query e. JDBC APIs Per ulteriori informazioni, consulta Utilizzo di connettori e connessioni con AWS Glue Studio.

21 dicembre 2020

Support per l'esecuzione ETL di processi di streaming nella AWS Glue versione 2.0

Sono state aggiunte informazioni sul supporto per l'esecuzione di ETL lavori di streaming nella versione 2.0 di Glue. Per ulteriori informazioni, consulta Aggiungere ETL lavori di streaming in AWS Glue.

18 dicembre 2020

Supporto per il partizionamento del carico di lavoro con esecuzione limitata

Sono state aggiunte informazioni sull'abilitazione del partizionamento del carico di lavoro per configurare i limiti superiori della dimensione del set di dati o il numero di file elaborati durante le esecuzioni dei job. ETL Per ulteriori informazioni, consulta Partizionamento del carico di lavoro con esecuzione limitata.

23 novembre 2020

Supporto per una gestione avanzata delle partizioni

Sono state aggiunte informazioni su come utilizzare new per aggiungere o eliminare un indice APIs di partizione da/a una tabella esistente. Per ulteriori informazioni, consulta Utilizzo degli indici delle partizioni.

23 novembre 2020

Supporto per il registro degli schemi di AWS Glue

Sono state aggiunte informazioni sull'utilizzo del registro degli schemi di AWS Glue per l'individuazione, il controllo e l'evoluzione in modo centralizzato degli schemi. Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

19 novembre 2020

Support per il formato di input grok nei lavori di streaming ETL

Aggiunte informazioni sull'applicazione dei pattern Grok alle origini di streaming, ad esempio i file di log. Per ulteriori informazioni, consulta Applicazione di pattern Grok alle sorgenti di streaming.

17 novembre 2020

Supporto per l'aggiunta di tag ai flussi di lavoro nella console AWS Glue

Sono state aggiunte informazioni sull'aggiunta di tag durante la creazione di un flusso di lavoro utilizzando la console AWS Glue. Per ulteriori informazioni, consulta Creazione e generazione di un flusso di lavoro nella console AWS Glue.

27 ottobre 2020

Supporto per le esecuzione incrementale del crawler

Aggiunte informazioni sul supporto per le esecuzioni di crawler incrementali, che eseguono il crawling solo delle cartelle Amazon S3 aggiunte dall'ultima esecuzione. Per ulteriori informazioni, consulta Crawling incrementale.

21 ottobre 2020

Supporto per il rilevamento dello schema per le fonti di ETL dati in streaming. supporto per sorgenti di dati in streaming Avro e kafka ETL autogestito

I job di estrazione, trasformazione e caricamento (ETL) in streaming ora AWS Glue possono rilevare automaticamente lo schema dei record in entrata e gestire le modifiche allo schema per record. Sono ora supportate le origini di dati Kafka autogestite. I ETL job di streaming ora supportano il formato Avro nelle fonti di dati. Per ulteriori informazioni, consulta Streaming ETL in AWS Glue, Definizione delle proprietà del lavoro per un ETL lavoro di streaming e Note e restrizioni per le sorgenti di streaming Avro.

7 ottobre 2020

Supporto per il crawling delle origini dei dati MongoDB e DocumentDB

Aggiunte informazioni sul supporto per il crawling delle origini dati MongoDB e Amazon DocumentDB (con compatibilità MongoDB). Per ulteriori informazioni, consulta Definizione di crawler.

5 ottobre 2020

Support per la FIPS conformità

Sono state aggiunte informazioni sugli FIPS endpoint per i clienti che richiedono FIPS 140-2 moduli crittografici convalidati per accedere ai dati utilizzando. AWS Glue Per ulteriori informazioni, consulta Conformità. FIPS

23 settembre 2020

AWS Glue Studio fornisce un'interfaccia visiva facile da usare per la creazione e il monitoraggio dei processi

Ora è possibile utilizzare una semplice interfaccia grafica per comporre lavori che spostano e trasformano i dati ed eseguirli su AWS Glue. È quindi possibile utilizzare la dashboard Job Run AWS Glue Studio per monitorare ETL l'esecuzione e garantire che i job funzionino come previsto. Per ulteriori informazioni, consulta la Guida per l'utente di AWS Glue Studio.

23 settembre 2020

Supporto per la creazione di indici di tabella per migliorare le prestazioni delle query

Aggiunte informazioni sulla creazione di indici di tabella per consentire il recupero di un sottoinsieme di partizioni da una tabella. Per ulteriori informazioni, consulta Utilizzo degli indici delle partizioni.

9 settembre 2020

Support per tempi di avvio ridotti durante l'esecuzione di ETL job Apache Spark nella AWS Glue versione 2.0.

Sono state aggiunte informazioni sul supporto per la AWS Glue versione 2.0 che fornisce un'infrastruttura aggiornata per l'esecuzione dei ETL job di Apache Spark con tempi di avvio ridotti, modifiche nella registrazione e supporto per specificare moduli Python aggiuntivi a livello di job. Per ulteriori informazioni, consulta Note di AWS Glue rilascio e Running Spark Jobs with Reduced Startup Times ETL.

10 agosto 2020

Supporto per limitare il numero di esecuzioni simultanee del flusso di lavoro.

Aggiunte informazioni su come limitare il numero di esecuzioni simultanee per un determinato flusso di lavoro. Per ulteriori informazioni, consulta Creazione e generazione di un flusso di lavoro utilizzando la console AWS Glue.

10 agosto 2020

Supporto per la scansione di un data store Amazon S3 utilizzando un endpoint VPC

Sono state aggiunte informazioni sulla configurazione del tuo data store Amazon S3 a cui accedere solo da un ambiente Amazon Virtual Private Cloud (VPCAmazon), per scopi di sicurezza, audit o controllo. Per ulteriori informazioni, consulta Scansione di un Amazon S3 Data Store utilizzando un endpoint. VPC

7 agosto 2020

Supporto per la ripresa delle esecuzioni del flusso di lavoro

Aggiunte informazioni su come riprendere le esecuzioni del flusso di lavoro completate solo parzialmente perché uno o più nodi (processi o crawler) non sono stati completati correttamente. Per ulteriori informazioni, consulta Ripresa e ripristino dell'esecuzione di un flusso di lavoro.

27 luglio 2020

Supporto per l'abilitazione di certificati emessi da CA privati nelle connessioni Kafka in AWS Glue.

Aggiunte informazioni sulle nuove opzioni di connessione che supportano l'abilitazione dei certificati emessi da una CA privati per le connessioni Kafka in AWS Glue. Per ulteriori informazioni, consulta Tipi e opzioni di connessione per ETL i parametri interni AWS Glue e speciali utilizzati da. AWS Glue

20 luglio 2020

Supporto per la lettura dei dati DynamoDB in un altro account

Aggiunte informazioni sul supporto AWS Glue per la lettura di dati da una tabella DynamoDB di un altro account AWS . Per ulteriori informazioni, consulta Lettura dai dati DynamoDB in un altro account.

17 luglio 2020

Supporto per una connessione al writer DynamoDB nella versione AWS Glue 1.0 o successive

Aggiunte informazioni sul supporto per il writer DynamoDB e opzioni di connessione nuove o aggiornate per la lettura o la scrittura di DynamoDB. Per ulteriori informazioni, vedere Tipi e opzioni di connessione per ETL in AWS Glue.

17 luglio 2020

Supporto per i collegamenti alle risorse e per il controllo degli accessi tra account utilizzando sia AWS Glue che Lake Formation

Aggiunti contenuti relativi a nuovi oggetti del catalogo dati denominati link alle risorse e a come gestire la condivisione delle risorse del catalogo dati tra gli account sia con AWS Glue che con AWS Lake Formation. Per ulteriori informazioni, consulta Concedere l'accesso multi-account e Link alle risorse della tabella.

7 luglio 2020

Supporto per il campionamento dei registri durante il crawling dei datastore DynamoDB

Sono state aggiunte informazioni sulle nuove proprietà che puoi configurare durante il crawling di un datastore DynamoDB. Per ulteriori informazioni, consulta Proprietà del crawler.

12 giugno 2020

Supporto per l'arresto di un'esecuzione del flusso di lavoro.

Sono state aggiunte informazioni su come interrompere l'esecuzione di un flusso di lavoro per un determinato flusso di lavoro. Per ulteriori informazioni, vedere Arresto di un'esecuzione del flusso di lavoro.

14 maggio 2020

Support per i lavori di streaming ETL di Spark

Sono state aggiunte informazioni sulla creazione di lavori di estrazione, trasformazione e caricamento (ETL) con sorgenti di dati in streaming. Per ulteriori informazioni, vedete Aggiungere ETL lavori di streaming in AWS Glue.

27 aprile 2020

Support per la creazione di tabelle, l'aggiornamento dello schema e l'aggiunta di nuove partizioni nel Data Catalog dopo l'esecuzione di un job ETL

Sono state aggiunte informazioni su come abilitare la creazione di tabelle, l'aggiornamento dello schema e l'aggiunta di nuove partizioni per visualizzare i risultati del ETL lavoro nel Data Catalog. Per ulteriori informazioni, vedere Creazione di tabelle, aggiornamento dello schema e aggiunta di nuove partizioni nel catalogo dati da AWS Glue ETL Jobs.

2 aprile 2020

Support per specificare una versione per il formato di dati Apache Avro come ETL input e output in AWS Glue

Sono state aggiunte informazioni sulla specificazione di una versione per il formato di dati Apache Avro come input e output in. ETL AWS Glue La versione predefinita 1.7. Puoi utilizzare l'opzione del formato version per specificare Avro versione 1.8 per abilitare la lettura/scrittura logica. Per ulteriori informazioni, consulta Opzioni di formato per ingressi e ETL uscite in. AWS Glue

31 marzo 2020

Support per il committer EMRFS ottimizzato per S3 per la scrittura di dati Parquet in Amazon S3

Sono state aggiunte informazioni su come impostare un nuovo flag per abilitare il committer EMRFR ottimizzato per S3 per la scrittura di dati Parquet in Amazon S3 durante la creazione o l'aggiornamento di un lavoro. AWS Glue Per ulteriori informazioni, consulta Parametri speciali usati da AWS Glue.

30 marzo 2020

Il supporto per l'apprendimento automatico si trasforma in una risorsa gestita da tag di AWS risorse

Sono state aggiunte informazioni sull'utilizzo dei tag AWS delle risorse per gestire e controllare l'accesso alle trasformazioni del machine learning. AWS Glue Puoi assegnare tag di AWS risorsa a job, trigger, endpoint, crawler e trasformarsi in machine learning. AWS Glue Per ulteriori informazioni sui tag, consultare Tag AWS in AWS Glue.

2 marzo 2020

Supporto per argomenti di lavoro non sovrascrivibili

Aggiunte informazioni sul supporto per parametri di lavoro speciali che non possono essere sovrascritti nei trigger o quando si esegue il processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

12 febbraio 2020

Supporto per nuove trasformazioni per l'utilizzo con set di dati in Amazon S3

Sono state aggiunte informazioni sulle nuove trasformazioni (Merge, Purge e Transition) ed esclusioni delle classi di storage Amazon S3 per applicazioni Apache Spark per l'utilizzo con set di dati in Amazon S3. Per ulteriori informazioni sul supporto per queste trasformazioni per Python, mergeDynamicFrameconsulta Working with Datasets in Amazon S3. Per Scala, vedi e Scala. mergeDynamicFramesAWS Glue GlueContext APIs

16 gennaio 2020

Support per l'aggiornamento del Data Catalog con nuove informazioni sulle partizioni da un lavoro ETL

Sono state aggiunte informazioni su come codificare uno script di estrazione, trasformazione e caricamento (ETL) per aggiornarlo AWS Glue Data Catalog con nuove informazioni sulla partizione. Con questa caratteristica, non è più necessario eseguire nuovamente il crawler al termine del processo per visualizzare le nuove partizioni. Per ulteriori informazioni, consulta Aggiornamento del catalogo dati con nuove partizioni.

15 gennaio 2020

Nuovo tutorial: utilizzo di un notebook SageMaker

È stato aggiunto un tutorial che dimostra come usare un SageMaker notebook Amazon per aiutarti a sviluppare i tuoi script ETL e quelli di machine learning. Vedi il tutorial: Usa un Amazon SageMaker Notebook con il tuo endpoint di sviluppo.

3 gennaio 2020

Supporto per la lettura da MongoDB e Amazon DocumentDB (compatibile con MongoDB)

Aggiunte informazioni sui nuovi tipi di connessione e opzioni di connessione per leggere e scrivere su MongoDB e Amazon DocumentDB (con compatibilità MongoDB). Per ulteriori informazioni, consulta Tipi e opzioni di connessione per ETL in AWS Glue.

17 dicembre 2019

Varie correzioni e chiarimenti

Sono state aggiunte diverse correzioni e chiarimenti. Sono state rimosse delle voci dal capitolo Problemi noti. Sono stati aggiunti avvisi che AWS Glue supportano solo le chiavi master simmetriche del cliente (CMKs) quando si specificano le impostazioni di crittografia del Data Catalog e si creano configurazioni di sicurezza. Aggiunta una nota indicante che AWS Glue non supporta la scrittura in Amazon DynamoDB.

9 dicembre 2019

Support per JDBC driver personalizzati

Sono state aggiunte informazioni sulla connessione a sorgenti e destinazioni di dati con JDBC driver che AWS Glue non supportano in modo nativo, come My SQL version 8 e Oracle Database versione 18. Per ulteriori informazioni, vedere JDBC connectionType Valori.

25 novembre 2019

Support per il collegamento di SageMaker notebook a diversi endpoint di sviluppo

Sono state aggiunte informazioni su come collegare un SageMaker notebook a diversi endpoint di sviluppo. Aggiornamenti per descrivere la nuova azione della console per il passaggio a un nuovo endpoint di sviluppo e la nuova SageMaker IAM policy. Per ulteriori informazioni, consulta Working with Notebooks on the AWS Glue Console e Creazione di una policy IAM per Amazon Notebooks. SageMaker

21 novembre 2019

Supporto per la versione AWS Glue nelle trasformazioni di machine learning

Sono state aggiunte informazioni sulla definizione della versione AWS Glue in una trasformazione di machine learning per indicare la versione di AWS Glue con cui è compatibile una trasformazione di machine learning. Per ulteriori informazioni, consulta Operare con le trasformazioni basate su machine learning nella console di AWS Glue.

21 novembre 2019

Supporto per il riavvolgimento dei segnalibri di processo

Sono state aggiunte informazioni sul riavvolgimento dei segnalibri di processo per qualsiasi esecuzione precedente, con conseguente rielaborazione dei dati dell'esecuzione del processo successivo solo dall'esecuzione del processo con il segnalibro. Sono descritte due nuove opzioni secondarie per l'opzione job-bookmark-pause che consentono di eseguire un processo tra due segnalibri. Per ulteriori informazioni, consulta Monitoraggio dei dati elaborati mediante segnalibri di processo e Parametri speciali usati da AWS Glue.

22 ottobre 2019

Support per JDBC certificati personalizzati per la connessione a un archivio dati

Sono state aggiunte informazioni sul AWS Glue supporto dei JDBC certificati personalizzati per SSL le connessioni a sorgenti o destinazioni di AWS Glue dati. Per ulteriori informazioni, consulta Uso di connessioni nella console AWS Glue.

10 ottobre 2019

Supporto per Python wheel

Sono state aggiunte informazioni sul supporto AWS Glue di file wheel (insieme ai file egg) come dipendenze per processi shell di Python. Per ulteriori informazioni, consulta Fornire la propria libreria Python.

26 settembre 2019

Supporto per il controllo delle versioni di endpoint di sviluppo in AWS Glue

Sono state aggiunte informazioni sulla definizione di Glue version negli endpoint di sviluppo. Glue version determina le versioni di Apache Spark e Python supportate da AWS Glue. Per ulteriori informazioni, consulta Aggiunta di un endpoint di sviluppo.

19 settembre 2019

Supporto per il monitoraggio di AWS Glue tramite l'interfaccia utente di Spark

Sono state aggiunte informazioni sull'utilizzo dell'interfaccia utente di Apache Spark per monitorare ed eseguire il debug dei AWS Glue ETL job in esecuzione sul AWS Glue job system e delle applicazioni Spark sugli endpoint di sviluppo. AWS Glue Per ulteriori informazioni, consulta Monitoraggio di AWS Glue mediante l'interfaccia utente di Spark.

19 settembre 2019

Miglioramento del supporto per lo sviluppo di script locali utilizzando la libreria pubblica ETL AWS Glue ETL

È stato aggiornato il contenuto della AWS Glue ETL libreria per riflettere il fatto che la AWS Glue versione 1.0 è ora supportata. Per ulteriori informazioni, consultate Sviluppo e test di ETL script a livello locale utilizzando la AWS Glue ETL libreria.

18 settembre 2019

Supporto per l'esclusione delle classi di archiviazione Amazon S3 durante l'esecuzione di processi

Sono state aggiunte informazioni sull'esclusione delle classi di storage Amazon S3 durante l'esecuzione di AWS Glue ETL processi che leggono file o partizioni da Amazon S3. Per ulteriori informazioni, consulta Esclusione delle classi di storage Amazon S3.

29 agosto 2019

Support per lo sviluppo di ETL script locali utilizzando la AWS Glue ETL libreria pubblica

Sono state aggiunte informazioni su come sviluppare e testare ETL gli script Python e Scala localmente senza la necessità di una connessione di rete. Per ulteriori informazioni, consulta Sviluppo e test di ETL script a livello locale utilizzando la libreria. AWS Glue ETL

28 agosto 2019

Problemi noti

Sono state aggiunte informazioni sui problemi noti in AWS Glue. Per ulteriori informazioni, consulta Problemi noti per AWS Glue.

28 agosto 2019

Supporto per le trasformazioni di machine learning in AWS Glue

Sono state aggiunte informazioni sulle caratteristiche di machine learning fornite da AWS Glue per creare trasformazioni personalizzate. È possibile creare queste trasformazioni al momento della creazione di un processo. Per ulteriori informazioni, consulta Trasformazioni basate su machine learning in AWS Glue.

8 agosto 2019

Supporto per Amazon Virtual Private Cloud condiviso

Aggiunte informazioni sul supporto AWS Glue per Amazon Virtual Private Cloud condiviso. Per ulteriori informazioni, consulta Shared Amazon VPCs.

6 agosto 2019

Supporto per il controllo delle versioni in AWS Glue

Sono state aggiunte informazioni sulla definizione di Glue version nelle proprietà del processo. AWS Glue determina le versioni di Apache Spark e Python supportate da AWS Glue. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

24 luglio 2019

Supporto per le opzioni di configurazione aggiuntive per gli endpoint di sviluppo

Sono state aggiunte informazioni sulle opzioni di configurazione per gli endpoint di sviluppo con carichi di lavoro intensi in termini di memoria. È possibile scegliere tra due nuove configurazioni che offrono maggiore quantità di memoria per esecutore. Per ulteriori informazioni, consulta Uso di endpoint di sviluppo nella console AWS Glue.

24 luglio 2019

Support per l'esecuzione di attività di estrazione, trasferimento e caricamento (ETL) utilizzando i flussi di lavoro

Sono state aggiunte informazioni sull'utilizzo di un nuovo costrutto chiamato workflow per progettare un'attività complessa di estrazione, trasformazione e caricamento (ETL) che AWS Glue può essere eseguita e monitorata come un'unica entità. Per ulteriori informazioni, vedere Esecuzione di ETL attività complesse utilizzando flussi di lavoro in. AWS Glue

20 giugno 2019

Supporto per Python 3.6 in processi shell di Python

Sono state aggiunte informazioni sul supporto di Python 3.6 in processi shell di Python. Puoi specificare Python 2.7 o Python 3.6 come proprietà di un processo. Per ulteriori informazioni, consulta Aggiunta di processi shell di Python in AWS Glue.

5 giugno 2019

Support per endpoint di cloud privato virtuale (VPC)

Sono state aggiunte informazioni sulla connessione diretta AWS Glue tramite un endpoint di interfaccia nel tuo. VPC Quando si utilizza un endpoint di VPC interfaccia, la comunicazione tra l'utente VPC e l'utente AWS Glue viene condotta in modo completo e sicuro all'interno della rete. AWS Per ulteriori informazioni, consulta Utilizzo AWS Glue con VPC gli endpoint.

4 giugno 2019

Supporto per la registrazione continua in tempo reale per processi AWS Glue.

Sono state aggiunte informazioni sull'attivazione e la visualizzazione dei log dei job di Apache Spark in tempo reale, CloudWatch inclusi i registri dei driver, i log di ciascun executor e una barra di avanzamento dei job Spark. Per ulteriori informazioni, consulta l'articolo relativo alla registrazione continua dei processi AWS Glue.

28 maggio 2019

Supporto per le tabelle del Catalogo Dati esistenti come origini crawler

Sono state aggiunte informazioni su come specificare un elenco di tabelle del catalogo dati esistenti come origini crawler. I crawler possono quindi rilevare le modifiche agli schemi di tabella, aggiornare le definizioni di tabella e registrare nuove partizioni quando i nuovi dati diventano disponibili. Per ulteriori informazioni, consulta Proprietà dei crawler.

10 maggio 2019

Supporto per le opzioni di configurazione aggiuntive per i processi con elevati requisiti di memoria

Sono state aggiunte informazioni sulle opzioni di configurazione per i processi Apache Spark con carichi di lavoro con elevati requisiti di memoria. È possibile scegliere tra due nuove configurazioni che offrono maggiore quantità di memoria per esecutore. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

5 aprile 2019

Support per CSV classificatori personalizzati

Sono state aggiunte informazioni sull'utilizzo di un CSV classificatore personalizzato per dedurre lo schema di vari tipi di dati. CSV Per ulteriori informazioni, consulta Scrittura di classificatori personalizzati.

26 marzo 2019

Support per i tag AWS delle risorse

Sono state aggiunte informazioni sull'utilizzo dei tag AWS delle risorse per aiutarti a gestire e controllare l'accesso alle tue AWS Glue risorse. Puoi assegnare tag di AWS risorsa a job, trigger, endpoint e crawler in. AWS Glue Per ulteriori informazioni sui tag, consultare Tag AWS in AWS Glue.

20 marzo 2019

Support di Data Catalog per i lavori Spark SQL

Sono state aggiunte informazioni sulla configurazione dei AWS Glue job e degli endpoint di sviluppo per utilizzarli AWS Glue Data Catalog come Apache Hive Metastore esterno. Ciò consente ai job e agli endpoint di sviluppo di eseguire direttamente le query Apache SQL Spark sulle tabelle memorizzate in. AWS Glue Data Catalog Per ulteriori informazioni, consulta AWS Glue Data Catalog Support for Spark SQL Jobs.

14 marzo 2019

Supporto per processi shell di Python

Aggiunte informazioni sui processi shell di Python e il nuovo campo Maximum capacity (Capacità massima). Per ulteriori informazioni, consulta l'argomento relativo all'aggiunta di processi shell di Python in AWS Glue.

18 gennaio 2019

Supporto per le notifiche quando sono presenti modifiche di database e di tabelle

Sono state aggiunte informazioni sugli eventi generati per le modifiche alle chiamate di database, tabelle e partizioniAPI. È possibile configurare le azioni in CloudWatch Eventi per rispondere a questi eventi. Per ulteriori informazioni, consulta Automazione AWS Glue con CloudWatch eventi.

16 gennaio 2019

Supporto per la crittografia delle password di connessione

Aggiunte informazioni sulla crittografia di password utilizzate in oggetti di connessione. Per ulteriori informazioni, consulta Crittografia delle password di connessione.

11 dicembre 2018

Supporto per le autorizzazioni a livello della risorsa e per le policy basate sulla risorsa

Aggiunte informazioni sull'utilizzo di autorizzazioni a livello della risorsa e delle policy basate sulla risorsa con AWS Glue. Per ulteriori informazioni, consulta gli argomenti indicati in Sicurezza in AWS Glue.

15 ottobre 2018

Support per SageMaker notebook

Sono state aggiunte informazioni sull'utilizzo di SageMaker notebook con endpoint di sviluppo. AWS Glue Per ulteriori informazioni, consulta Gestione di notebook.

5 ottobre 2018

Supporto per la crittografia

Aggiunta di informazioni sull'uso della crittografia con AWS Glue. Per ulteriori informazioni, consulta Crittografia dei dati inattivi, Crittografia dei dati in transito e Configurazione della crittografia in AWS Glue.

24 agosto 2018

Supporto per i parametri di processo Apache Spark

Sono state aggiunte informazioni sull'uso delle metriche di Apache Spark per migliorare il debug e la profilazione dei lavori. ETL Puoi monitorare facilmente le metriche di runtime, come i byte letti e scritti, l'utilizzo della memoria e il CPU carico del driver e degli esecutori e lo spostamento dei dati tra gli esecutori dalla console. AWS Glue Per ulteriori informazioni, consulta Monitoring AWS Glue Using CloudWatch Metrics, Job Monitoring and Debugging e Working with Jobs on the Console. AWS Glue

13 luglio 2018

Supporto di DynamoDB come origine dati

Sono state aggiunte informazioni sulla scansione di DynamoDB e sul suo utilizzo come fonte di dati per i lavori. ETL Per ulteriori informazioni, consulta Catalogazione di tabelle con un crawler e Parametri di connessione.

10 luglio 2018

Aggiornamenti alla procedura di creazione di un server notebook

Informazioni aggiornate su come creare un server notebook su un'EC2istanza Amazon associata a un endpoint di sviluppo. Per ulteriori informazioni, consulta Creazione di un server notebook associato a un endpoint di sviluppo.

9 luglio 2018

Gli aggiornamenti sono ora disponibili su RSS

Ora puoi iscriverti a un RSS feed per ricevere notifiche sugli aggiornamenti della AWS Glue Developer Guide.

25 giugno 2018

Supporto delle notifiche di ritardo per i processi

Aggiunte informazioni sulla configurazione di una soglia di ritardo durante l'esecuzione di un processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

25 maggio 2018

Configurazione di un crawler per aggiungere nuove colonne

Sono state aggiunte informazioni sulla nuova opzione di configurazione per i crawler,. MergeNewColumns Per maggiori informazioni, consulta Configurazione di un crawler.

7 maggio 2018

Supporto del timeout dei processi

Aggiunte informazioni sull'impostazione di una soglia di timeout durante l'esecuzione di un processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

10 aprile 2018

Supporta ETL lo script Scala e attiva i lavori in base a stati di esecuzione aggiuntivi

Sono state aggiunte informazioni sull'uso di Scala come linguaggio ETL di programmazione. Inoltre, il grilletto API ora supporta l'attivazione quando vengono soddisfatte tutte le condizioni (oltre a tutte le condizioni). Inoltre, i processi possono essere attivati sulla base di un'esecuzione processo "non riuscita" o "arrestata" (in aggiunta a un'esecuzione processo "riuscita").

12 gennaio 2018

Aggiornamenti precedenti

La tabella seguente descrive le modifiche importanti apportate in ogni versione della Guida per sviluppatori AWS Glue prima di gennaio 2018.

Modifica Descrizione Data
Supporta fonti di XML dati e nuova opzione di configurazione del crawler Sono state aggiunte informazioni sulla classificazione delle fonti di XML dati e nuova opzione crawler per le modifiche alle partizioni. 16 novembre 2017
Nuove trasformazioni, supporto per motori di RDS database Amazon aggiuntivi e miglioramenti degli endpoint di sviluppo Sono state aggiunte informazioni sulle trasformazioni di mappe e filtri, supporto per Amazon RDS Microsoft SQL Server e Amazon RDS Oracle e nuove funzionalità per gli endpoint di sviluppo. 29 settembre 2017
Versione iniziale di AWS Glue Questa è la versione iniziale della Guida per gli sviluppatori di AWS Glue . 14 agosto 2017