Cronologia della documentazione per AWS Glue - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Cronologia della documentazione per AWS Glue

ModificaDescrizioneData

Integrazione dei dati di Amazon Q in AWS Glue (anteprima)

L'integrazione dei dati di Amazon Q in AWS Glue è una nuova funzionalità di IA generativa di AWS Glue che consente ai data engineer e agli sviluppatori ETL di creare processi di integrazione dei dati utilizzando il linguaggio naturale. Gli ingegneri e gli sviluppatori possono chiedere a Q di creare processi, risolvere problemi e rispondere a domande su AWS Glue e sull'integrazione dei dati. Per ulteriori informazioni, consulta Integrazione dei dati di Amazon Q in AWS Glue. Questa funzionalità include un aggiornamento della policy AwsGlueSessionUserRestrictedNotebookPolicy gestita da AWS. Per ulteriori informazioni, consulta l'argomento relativo agli Aggiornamenti di AWS Glue sulle policy gestite da AWS.

30 gennaio 2024

Aggiornamento della documentazione in relazione ad AWS Glue Streaming

Aggiunto un nuovo capitolo con contenuti nuovi e riorganizzati per AWS Glue lo streaming. Questi contenuti descrivono il funzionamento di AWS Glue Streaming, le caratteristiche dell'elaborazione dei dati in tempo reale e le modalità di monitoraggio dei processi di streaming. Per ulteriori informazioni, consulta la pagina AWS Glue Streaming.

27 dicembre 2023

Supporto per l'utilizzo del rilevamento dei dati sensibili granulari

La trasformazione relativa al rilevamento dei dati sensibili fornisce la possibilità di rilevare, mascherare o rimuovere le entità che hai definito o che sono predefinite da AWS Glue. Le azioni granulari consentono inoltre di applicare un'azione specifica per entità. Per ulteriori informazioni, consulta Utilizzo del rilevamento dei dati sensibili granulari.

26 novembre 2023

Supporto per il monitoraggio dei processi con parametri AWS Glue di osservabilità

Utilizza i parametri AWS Glue di osservabilità per generare approfondimenti su ciò che accade all'interno di AWS Glue per i processi di Apache Spark e migliorare la classificazione e l'analisi dei problemi. Per ulteriori informazioni, consulta Monitoraggio con parametri AWS Glue di osservabilità.

26 novembre 2023

Supporto per il rilevamento delle anomalie in Qualità dei dati di AWS Glue

Il rilevamento delle anomalie relative a Qualità dei dati di AWS Glue applica nel tempo algoritmi di machine learning (ML) alle statistiche sui dati per rilevare modelli anomali e problemi nascosti di qualità dei dati che sono difficili da individuare attraverso le regole. Per ulteriori informazioni, consulta Rilevamento delle anomalie in Qualità dei dati di AWS Glue.

26 novembre 2023

Aggiornamento al comportamento di registrazione predefinito dell'interfaccia utente di Spark

I processi Spark che generano i log dell'interfaccia utente di Spark ora verranno scritti con un modello di nome file diverso per supportare l'interfaccia utente di Spark nella console AWS Glue. Ciò non modifica il comportamento del CloudWatch registro. È possibile ripristinare il comportamento legacy aggiornando la configurazione del processo. Per ulteriori informazioni, consulta Monitoraggio dei processi tramite l'interfaccia utente Web di Apache Spark.

17 novembre 2023

Supporto per nuove origini dati in AWS Glue per Spark

Le connessioni ad Amazon OpenSearch Service, Azure SQL, Azure Cosmos for NoSQL, SAP HANA Teradata Vantage e Vertica sono ora supportate nativamente all'interno. AWS Glue Inoltre, le connessioni a queste origini dati, oltre a MongoDB, sono ora disponibili per l'uso nell'editor visivo AWS Glue Studio. Per ulteriori informazioni, consulta Tipi e opzioni di connessione per ETL in AWS Glue per Spark per informazioni su AWS Glue per il supporto di Spark e Aggiunta di una connessione AWS Glue per informazioni sull'uso nell'editor visivo AWS Glue Studio.

17 novembre 2023

Supporto per generare le statistiche delle colonne

È possibile calcolare statistiche a livello di colonna per tabelle AWS Glue Data Catalog in formati di dati come Parquet, ORC, JSON, ION, CSV e XML senza configurare pipeline di dati aggiuntive. Per ulteriori informazioni, consulta Utilizzo delle statistiche delle colonne.

16 novembre 2023

Supporto per la compattazione dei dati per le tabelle Iceberg

Per migliorare le prestazioni di lettura tramite servizi di analisi AWS come Amazon Athena e Amazon EMR e i processi ETL AWS Glue, il Catalogo dati offre la compattazione gestita (un processo che compatta piccoli oggetti Amazon S3 in oggetti più grandi) per le tabelle Iceberg. Per ulteriori informazioni, consulta Ottimizzazione delle tabelle Iceberg.

13 novembre 2023

Aggiornamento al comportamento di attesa dell'esecuzione del processo

Le esecuzioni del processo standard di shell (interprete di comandi) Spark e Python ora passeranno a WAITING in determinate situazioni, anziché passare immediatamente a FAILED. Per ulteriori informazioni, consulta Stati di esecuzione dei processi AWS Glue.

8 novembre 2023

Guida per l'utente AWS Glue Studio consolidata nella guida per sviluppatori AWS Glue

La guida per l'utente AWS Glue Studio è stata spostata nella guida per sviluppatori per creare un'unica guida utente completa per AWS Glue Studio, la console AWS Glue e l'accesso a AWS Glue Studio a livello di programmazione.

25 ottobre 2023

Aggiornamento alla policy gestita AWSGlueServiceNotebookRole AWS

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueServiceNotebookRole AWS gestita. Per ulteriori informazioni, consulta l'argomento relativo agli aggiornamenti AWS Glue sulle policy gestite AWS.

9 ottobre 2023

AWS Glue Studio supporta cinque nuove trasformazioni integrate

AWS Glue Studio supporta le seguenti cinque nuove trasformazioni integrate: Corrispondenza dei record, Rimuovi righe nulle, Analizza colonna JSON, Estrai percorso JSON ed Estrattore Regex. Per ulteriori informazioni, consulta la pagina Editing AWS Glue managed data transform nodes.

11 agosto 2023

Aggiornamento della politica AWSGlueServiceRole AWS gestita

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueServiceRole AWS gestita. Per ulteriori informazioni, consulta l'argomento relativo agli aggiornamenti AWS Glue sulle policy gestite AWS.

4 agosto 2023

Supporto per il crawling delle tabelle Apache Hudi

Sono state aggiunte informazioni sull'utilizzo di AWS Glue per eseguire il crawling delle tabelle Hudi nei bucket Amazon S3 e sulla registrazione delle tabelle Hudi in AWS Glue Data Catalog. Per ulteriori informazioni, consulta le pagine Which data stores can I crawl? e Crawler properties.

21 luglio 2023

Aggiornamento della politica AWSGlueConsoleFullAccess AWS gestita

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta l'argomento relativo agli aggiornamenti AWS Glue sulle policy gestite AWS.

14 luglio 2023

Supporto per il crawling delle tabelle Apache Iceberg

Sono state aggiunte informazioni sull'utilizzo di AWS Glue per eseguire il crawling delle tabelle Iceberg nei bucket Amazon S3 e sulla registrazione delle tabelle Iceberg in AWS Glue Data Catalog. Per ulteriori informazioni, consulta le pagine Which data stores can I crawl? e Crawler properties.

7 luglio 2023

Supporto per AWS Glue con Ray

Sono state aggiunte informazioni su AWS Glue Ray, un nuovo motore in grado di supportare i processi AWS Glue. È stato riorganizzato il contenuto esistente relativo a AWS Glue con Spark per chiarire le ambiguità.

30 maggio 2023

Supporto per Qualità dei dati di AWS Glue (GA)

Qualità dei dati di AWS Glue è ora disponibile a livello generale. AWS Glue Qualità dei dati consente di valutare e monitorare la qualità dei dati. Per informazioni su come utilizzare Qualità dei dati di AWS Glue con Catalogo dati, consulta la pagina Qualità dei dati di AWS Glue. Per ulteriori informazioni su Qualità dei dati di AWS Glue per AWS Glue Studio, consulta la pagina Evaluating data quality with AWS Glue Studio.

24 maggio 2023

Supporto per tipi di worker di grandi dimensioni per i processi Apache Spark

È ora disponibile il supporto per l'uso dei tipi di worker G.4X e G.8X per i processi Apache Spark. Questi tipi di worker sono adatti per i processi i cui carichi di lavoro contengono trasformazioni, aggregazioni, join e query con i maggiori requisiti. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

8 maggio 2023

Supporto per la creazione di indici di partizione durante il crawling delle tabelle

Sono state aggiunte informazioni sul modo in cui i crawler supportano la creazione di indici di partizione per le tabelle rilevate dal crawler. Per ulteriori informazioni, consulta la pagina Setting the partition index crawler configuration option.

24 aprile 2023

Supporto per i parametri di utilizzo delle risorse

Sono state aggiunte informazioni sulla visualizzazione dell'utilizzo delle risorse del servizio e sulla configurazione degli allarmi in Amazon. CloudWatch Per ulteriori informazioni, consulta la pagina AWS Glue resource monitoring.

7 aprile 2023

Aggiornamento della politica gestita AWSGlueConsoleFullAccess AWS

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta l'argomento relativo agli aggiornamenti AWS Glue sulle policy gestite AWS.

28 marzo 2023

È stata aggiunta una guida corredata da esempi per l'utilizzo di AWS Glue con un SDK AWS

La Guida per gli sviluppatori AWS Glue contiene due nuove sezioni che forniscono informazioni utili per l'utilizzo di AWS Glue con un SDK AWS. Per ulteriori informazioni, consulta Utilizzo di AWS Glue con un SDK AWS e Esempi di codice per AWS Glue utilizzando SDK AWS.

23 febbraio 2023

Aggiornamento della documentazione per IAM con AWS Glue

Riorganizzazione e aggiunta di informazioni sull'uso di IAM con AWS Glue. Per ulteriori informazioni, consulta Identity and Access Management per AWS Glue.

15 febbraio 2023

Supporto per l'esecuzione di processi ETL di streaming in AWS Glue versione 4.0

Sono state aggiunte informazioni sul supporto per l'esecuzione di processi ETL di streaming in Glue versione 4.0 e nuove opzioni per la connessione a un cluster Kafka o a un cluster Amazon Managed Streaming per Apache Kafka e flussi di dati Amazon Kinesis. Per ulteriori informazioni, consulta Aggiunta di processi ETL di streaming in AWS Glue e Tipi di connessione e opzioni per ETL in AWS Glue.

8 febbraio 2023

Supporto per il crawling delle origini dati MongoDB Atlas

Sono state aggiunte informazioni sull'utilizzo di AWS Glue per il crawling delle origini dati MongoDB Atlas. Per ulteriori informazioni, consulta Quali archivi di dati posso sottoporre a scansione? , proprietà di connessione MongoDB e MongoDB Atlas e Utilizzo di una connessione MongoDB o MongoDB Atlas.

6 febbraio 2023

Supporto per il crawling delle tabelle Delta Lake con un connettore Delta Lake nativo

Sono state aggiunte informazioni sull'utilizzo di AWS Glue per il crawling delle tabelle Delta Lake tramite un connettore Delta Lake nativo. Questa funzionalità ti consente di utilizzare i motori di query AWS per interrogare direttamente il log delle transazioni Delta e utilizzare funzionalità come i viaggi nel tempo e le garanzie ACID e per sincronizzare i metadati di Delta Lake dai file delle transazioni di Amazon S3 nel catalogo di dati per abilitare le autorizzazioni delle colonne sulle query in Lake Formation. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio di dati Delta Lake e Interrogazione delle tabelle Delta Lake.

15 dicembre 2022

Supporto per AWS Glue Data Quality (anteprima)

Il supporto è ora disponibile per AWS Glue Data Quality (anteprima). AWS Glue Data Quality consente di valutare e monitorare la qualità dei dati quando si usa AWS Glue 3.0. Per informazioni su come utilizzare AWS Glue Data Quality con il catalogo di dati, consulta AWS Glue Data Quality (anteprima). Per ulteriori informazioni su Qualità dei dati di AWS Glue per AWS Glue Studio, consulta la pagina Evaluating data quality with AWS Glue Studio.

30 novembre 2022

Supporto per un nuovo connettore Amazon Redshift Spark con nuove funzionalità e miglioramenti delle prestazioni

È ora disponibile il supporto per un nuovo connettore Amazon Redshift Spark con un nuovo driver JDBC da utilizzare con i processi ETL di AWS Glue per creare applicazioni Apache Spark che leggono e scrivono dati in Amazon Redshift come parte delle pipeline di importazione dei dati e trasformazione dei dati. Per ulteriori informazioni, consulta Spostamento di dati da e verso Amazon Redshift.

29 novembre 2022

Supporto per AWS Glue versione 4.0.

Aggiunte informazioni sul supporto per AWS Glue 4.0. Le funzionalità includono il supporto nativo per i framework data lake aperti con Apache Hudi, Delta Lake e Apache Iceberg e il supporto nativo per il plug-in di archiviazione cloud shuffle basato su Amazon S3 (un plug-in Apache Spark) per utilizzare Amazon S3 per la capacità di archiviazione shuffle ed elastica. Per ulteriori informazioni, consulta Note di rilascio di AWS Glue e Migrazione dei processi AWS Glue a AWS Glue versione 4.0.

28 novembre 2022

AWS Glue Studio ora offre trasformazioni visive personalizzate

Le trasformazioni visive personalizzate consentono ai clienti di definire, riutilizzare e condividere la logica ETL specifica dell'azienda tra i propri team. Per ulteriori informazioni, consulta Trasformazioni visive personalizzate.

28 novembre 2022

Supporto per l'utilizzo del crawler AWS Glue per pubblicare i metadati per i datastore JDBC

È ora disponibile il supporto per l'utilizzo del crawler AWS Glue per pubblicare metadati come commenti e tipi non elaborati nel catalogo di dati per i datastore JDBC. Per ulteriori informazioni, consulta Parametri impostati nelle tabelle del catalogo dati per crawler, proprietà del crawler e struttura. JdbcTarget

18 novembre 2022

Supporto per il crawling di datastore Snowflake

È ora disponibile il supporto per l'utilizzo di AWS Glue per eseguire il crawling delle tabelle e delle viste Snowflake e per pubblicare i metadati nel catalogo di dati come voce della tabella. Per le tabelle esterne Snowflake in Amazon S3, il crawler esegue il crawling anche della posizione Amazon S3 e del tipo di formato di file della tabella esterna e lo compila come parametri della tabella. Per ulteriori informazioni, consulta Quali datastore posso sottoporre a crawling?, Proprietà della connessione a AWS Glue e Parametri impostati nelle tabelle del catalogo di dati dal crawler.

18 novembre 2022

Supporto per una migliore gestione dello shuffle delle applicazioni Spark

È ora disponibile il supporto per un nuovo plug-in di archiviazione cloud shuffle per Apache Spark. Per ulteriori informazioni, consulta Plug-in shuffle di AWS Glue Spark con Amazon S3 e Plug-in di archiviazione cloud shuffle per Apache Spark.

15 novembre 2022

È stato aggiunto il supporto per le destinazioni catalogo dati quando si accelerano le notifiche di evento Amazon S3 del crawling

Oltre al supporto esistente per le destinazioni Amazon S3, ora è disponibile il supporto per accelerare il crawling per le destinazioni catalogo dati tramite notifiche di eventi Amazon S3. Per ulteriori informazioni, consulta Accelerazione del crawling usando le notifiche eventi di Amazon S3.

13 ottobre 2022

Supporto per specificare il numero massimo di tabelle che un crawler può creare

È ora disponibile il supporto per specificare il numero massimo di tabelle che il crawler può creare. Per ulteriori informazioni, consulta la pagina Come specificare il numero massimo di tabelle che il crawler può creare.

6 settembre 2022

Supporto per Python 3.9 in processi della shell Python in AWS Glue

È ora disponibile il supporto per l'esecuzione di script compatibili con Python 3.9 nei processi della shell (interprete di comandi) Python in AWS Glue e per la scelta dell'uso di set di librerie preconfezionati. Per ulteriori informazioni, consulta Processi della shell Python in AWS Glue.

11 agosto 2022

Supporto per l'esecuzione di processi AWS Glue non urgenti o non sensibili al tempo sulla capacità inutilizzata

È ora disponibile il supporto per la configurazione di esecuzioni flessibili per processi non urgenti come processi di pre-produzione, test e caricamenti di dati una tantum. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

9 agosto 2022

Il supporto per un nuovo tipo di worker per i processi di streaming

Il supporto di questo servizio di Support per l'uso del tipo di worker G.025X per processi di streaming a basso volume. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

14 luglio 2022

Il supporto per l'utilizzo di Kafka SASL in AWS Glue connessioni

Il supporto di Kafka SASL è ora disponibile in AWS Glue connessioni. Per ulteriori informazioni, consulta AWS Glue Proprietà di connessione Kafka per l'autenticazione client.

5 luglio 2022

Supporto per il connettore Apache Kafka per gli schemi protobuf

Il supporto di Apache Kafka Connector è attualmente disponibile per gli schemi Protobuf. Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

9 giugno 2022

Supporto per Auto Scaling per processi AWS Glue (GA)

Informazioni aggiuntive sull'utilizzo di Auto Scaling per i processi in AWS Glue versione 3.0 per scalare dinamicamente le risorse di calcolo. Per ulteriori informazioni, consulta Utilizzo di Auto Scaling per AWS Glue.

14 aprile 2022

Aggiornamento della documentazione per lo sviluppo di AWS Glue e i test di script di processo di AWS Glue

Informazioni riorganizzate e aggiunte sui metodi di sviluppo e test disponibili per AWS Glue, incluse le istruzioni per lo sviluppo con Docker. Per ulteriori informazioni, consulta Sviluppo e test di script di processo di AWS Glue.

14 marzo 2022

Aggiunta di buffer del protocollo (protobuf) come formato di dati supportato per il registro degli schemi di AWS Glue

Aggiunte informazioni su Protobuf come formato dati supportato (oltre ad AVRO e JSON). Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

25 febbraio 2022

Supporto per il crawling delle tabelle Delta Lake

Sono state aggiunte informazioni sull'utilizzo di AWS Glue per sottoporre a crawling le tabelle Delta Lake. Per ulteriori informazioni, consulta How to specify configuration options for a Delta Lake data store.(Come specificare le opzioni di configurazione per un archivio dati Delta Lake).

24 febbraio 2022

Supporto per informazioni sul processo di AWS Glue

Aggiunte informazioni sull'utilizzo delle informazioni sul processo di AWS Glue per semplificare il debug e l'ottimizzazione dei lavori per i tuoi processi AWS Glue. Per ulteriori informazioni, consulta Monitoraggio tramite le informazioni sui processi di AWS Glue.

8 febbraio 2022

Supporto per il crawling di tabelle Catalogo dati supportate da Amazon S3 utilizzando un endpoint VPC

Oltre all'archivio dati di Amazon S3, si possono configurare le tabelle Catalogo dati supportate da Amazon S3 per consentire l'accesso solo a un ambiente Amazon Virtual Private Cloud (Amazon VPC) per motivi di sicurezza, audit o controllo. Per ulteriori informazioni, consulta Crawling di un datastore Amazon S3 o di tabelle Catalogo dati supportate da Amazon S3 utilizzando un endpoint VPC.

3 febbraio 2022

Supporto per le tavole governate dalla Lake Formation

Aggiunte informazioni sul supporto AWS Glue per tabelle governate da Lake Formation, che supportano le transazioni ACID, la compattazione automatica dei dati e le query di viaggio nel tempo. Per ulteriori informazioni, consulta API AWS Glue, e Guida per gli sviluppatori di AWS Lake Formation.

30 novembre 2021

Nuove policy AWS gestite aggiunte per sessioni interattive e notebook

Le nuove policy gestite per IAM forniscono una maggiore sicurezza per l'utilizzo di AWS Glue con sessioni interattive e notebook. Per ulteriori informazioni, consulta la sezione Policy gestite da AWS per AWS Glue.

30 novembre 2021

Il registro dello schema Glue ora supportato con i processi di streaming

È possibile creare processi di streaming che accedono alle tabelle che fanno parte di Glue Schema Registry. Per ulteriori informazioni, consulta AWS Glue Schema Registry e Aggiunta di processi di streaming ETL in AWS Glue.

15 novembre 2021

Supporto per nuove caratteristiche di machine learning

Aggiunte informazioni sulle nuove funzionalità per la trasformazione di machine learning Ricerca corrispondenze, tra cui la corrispondenza incrementale e il punteggio di corrispondenza. Per ulteriori informazioni, consulta Ricerca di corrispondenze incrementali e Stima della qualità delle corrispondenze utilizzando i punteggi di confidenza delle corrispondenze.

31 ottobre 2021

(Anteprima privata) Supporto per processi flessibili di AWS Glue

Aggiunte informazioni sulla configurazione dei processi AWS Glue Spark con una classe di esecuzione flessibile, appropriata per i processi non sensibili al tempo i cui tempi di inizio e completamento possono variare. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

29 ottobre 2021

Supporto per accelerare il crawling usando le notifiche eventi di Amazon S3

Sono state aggiunte informazioni sull'accelerazione del crawling usando le notifiche eventi di Amazon S3. Per ulteriori informazioni, consulta Accelerazione del crawling usando le notifiche eventi di Amazon S3.

15 ottobre 2021

Ulteriori opzioni di configurazione della sicurezza relative al controllo degli accessi e ai VPC

Sono state aggiunte informazioni su come configurare nuove autorizzazioni per il controllo degli accessi su AWS Glue e le configurazione dei VPC. Per ulteriori informazioni, consulta Tag AWS in AWS Glue, Policy basate su identità (policy IAM) che controllano le impostazioni utilizzando chiavi di condizione o chiavi di contesto, e Configurazione di tutte le chiamate AWS affinché passino attraverso il VPC.

13 ottobre 2021

Supporto per le policy di endpoint VPC

Aggiunte informazioni sul supporto per policy endpoint Virtual Private Cloud (VPC) in AWS Glue. Per ulteriori informazioni consulta AWS Glue ed endpoint VPC di interfaccia (AWS PrivateLink).

11 ottobre 2021

Glue Studio è ora disponibile in Cina

AWS Glue Studio è ora disponibile nelle Regioni cinesi di Pechino e Ningxia.

11 ottobre 2021

AWS Glue Studio offre la creazione di notebook per la modifica interattiva dei processi

I notebook consentono di scrivere ed eseguire codice, visualizzare i risultati e condividere informazioni. In genere, i data scientist utilizzano i notebook per esperimenti e attività di esplorazione dei dati. Per ulteriori informazioni, consulta Utilizzo di notebook.

1° ottobre 2021

L'accesso diretto alle fonti di streaming ora disponibile

Quando si aggiungono origini dati al processo ETL nell'editor visivo, è possibile fornire informazioni per accedere al flusso di dati, anziché utilizzare un database e una tabella di Data Catalog.

30 settembre 2021

Documentata la policy di supporto versione AWS Glue

Aggiunte informazioni sulla policy di supporto versione AWS Glue e sulle fasi di fine vita per alcune versioni AWS Glue. Per ulteriori informazioni, consulta Policy di supporto versione AWS Glue.

24 settembre 2021

I connettori personalizzati possono ora essere utilizzati con le anteprime dei dati

Quando modifichi il nodo dell'origine dati utilizzando un connettore personalizzato, puoi visualizzare in anteprima il set di dati scegliendo la scheda Anteprima dati. Per ulteriori informazioni, consulta Connettori personalizzati.

24 settembre 2021

Supporto per sessioni interattive AWS Glue (anteprima privata)

(Anteprima privata) Aggiunte informazioni sull'uso delle sessioni interattive AWS Glue per eseguire carichi di lavoro Spark nel cloud da qualsiasi Jupyter Notebook. Le sessioni interattive sono il metodo preferito per sviluppare il tuo AWS Glue di estrazione, trasformazione e caricamento del codice (ETL), quando utilizzi AWS Glue 2.0 o versioni successive. Per ulteriori informazioni, consulta Configurazione e funzionamento delle sessioni interattive AWS Glue per notebook Jupyter.

24 agosto 2021

Supporto per la creazione di flussi di lavoro dai progetti (GA)

(Anteprima pubblica) Sono state aggiunte informazioni sulla codifica dei casi d'uso comuni di estrazione, trasformazione e caricamento (ETL) nei piani e sulla creazione di flussi di lavoro dai piani. Consente agli analisti di dati di creare ed eseguire facilmente processi ETL complessi. Per ulteriori informazioni, consulta Esecuzione di attività ETL complesse utilizzando gli schemi e i flussi di lavoro in AWS Glue.

23 agosto 2021

Supporto per AWS Glue versione 3.0.

Aggiunte informazioni sul supporto per AWS Glue versione 3.0 che supporta l'aggiornamento del motore Apache Spark 3.0 per l'esecuzione dei processi ETL di Apache Spark e altre ottimizzazioni e aggiornamenti. Per ulteriori informazioni, consulta Note di rilascio di AWS Glue e Migrating AWS Glue jobs to AWS Glue version 3.0. Altre caratteristiche di questa versione includono lo shuffle manager AWS Glue, un lettore CSV vettorizzato SIMD e predicati delle partizioni del catalogo. Per ulteriori informazioni, consulta AWS Glue Spark shuffle manager with Amazon S3, Opzioni di formato per input e output ETL in AWS Glue, e Server-side filtering using catalog partition predicates.

18 agosto 2021

AWS GovCloud (US) Region

AWS Glue Studio ora è disponibile in AWS GovCloud (US) Region

18 agosto 2021

Creazione di shell Python disponibile in AWS Glue Studio

Quando si crea un nuovo processo, è ora possibile scegliere di creare un processo di shell Python. Per ulteriori informazioni, consulta Avvio della creazione del processo e Modifica di processi shell Python in AWS Glue Studio.

13 agosto 2021

Support per l'avvio di un flusso di lavoro con un EventBridge evento Amazon

Aggiunte informazioni su come AWS Glue può essere un consumatore di eventi in un'architettura basata su eventi. Per ulteriori informazioni, consulta Avvio di un AWS Glue flusso di lavoro con un EventBridge evento Amazon e Visualizzazione degli EventBridge eventi che hanno avviato un flusso di lavoro.

14 luglio 2021

Aggiunta di JSON come formato di dati supportato per il registro degli schemi di AWS Glue

Aggiunte informazioni su JSON come formato dati supportato (oltre ad AVRO). Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

30 giugno 2021

Creare processi di streaming AWS Glue senza una tabella del catalogo dati

La funzione Python create_data_frame_from_options o getSource per gli script Scala supportano la creazione di processi ETL di streaming che fanno riferimento direttamente ai flussi di dati anziché richiedere una tabella del catalogo dati.

15 giugno 2021

Le trasformazioni di machine learning in AWS Glue ora supportano le chiavi AWS Key Management Service

È possibile specificare una configurazione di protezione o chiave AWS KMS durante la configurazione delle trasformazioni di Machine Learning AWS Glue con la console, la CLI o le API AWS Glue. Per ulteriori informazioni, consulta Utilizzo della crittografia dati con le trasformazioni basate su machine learning e API di Machine Learning AWS Glue.

15 giugno 2021

Aggiornamento della politica AWSGlueConsoleFullAccess AWS gestita

Sono state aggiunte informazioni su un aggiornamento minore alla politica AWSGlueConsoleFullAccess AWS gestita. Per ulteriori informazioni, consulta l'argomento relativo agli aggiornamenti AWS Glue sulle policy gestite AWS.

10 giugno 2021

Visualizzare il set di dati del processo durante la creazione e la modifica dei processi

È possibile utilizzare la nuova scheda di anteprima dati per un nodo nel diagramma del processo per visualizzare un esempio dei dati elaborati da tale nodo. Per ulteriori informazioni, consulta Utilizzo delle anteprime dei dati nell'editor visivo dei processi.

7 giugno 2021

Supporto per specificare un valore che indica la posizione della tabella per l'output del crawler.

Sono state aggiunte informazioni su come specificare un valore che indica la posizione della tabella durante la configurazione dell'output del crawler. Per ulteriori informazioni, consulta Come specificare la posizione della tabella.

4 giugno 2021

Supporto per il crawling di un campione di file in un set di dati durante il crawling di un archivio dati Amazon S3

Sono state aggiunte informazioni su come eseguire il crawling di un campione di file durante il crawling di Amazon S3. Per ulteriori informazioni, consulta Proprietà del crawler.

10 maggio 2021

Supporto per il AWS Glue writer parquet ottimizzato

Sono state aggiunte informazioni sull'utilizzo del parquet writer AWS Glue ottimizzato DynamicFrames per creare o aggiornare tabelle con la parquet classificazione. Per ulteriori informazioni, consulta Creazione di tabelle, aggiornamento dello schema e aggiunta di nuove partizioni nel catalogo dati da processi ETL AWS Glue e Opzioni di formato per input e output ETL in AWS Glue.

4 maggio 2021

Supporto per le password di autenticazione client Kafka

Sono state aggiunte informazioni su come lo streaming di processi ETL in AWS Glue supporta l'autenticazione del certificato client SSL con i produttori del flusso Apache Kafka. È ora possibile fornire un certificato personalizzato durante la definizione di una connessione AWS Glue a un cluster Apache Kafka, che AWS Glue utilizzerà durante l'autenticazione con esso. Per ulteriori informazioni, consulta Proprietà della connessione AWS Glue e API di connessione.

28 Aprile 2021

Supporto per l'utilizzo di dati da Amazon Kinesis Data Streams in un altro account nei processi ETL di streaming

Sono state aggiunte informazioni su come creare un processo ETL di streaming per utilizzare i dati da Amazon Kinesis Data Streams in un altro account. Per ulteriori informazioni, consulta Aggiunta di processi di streaming ETL in AWS Glue.

30 marzo 2021

Trasformazione SQL disponibile

Puoi utilizzare un nodo di trasformazione SQL per scrivere la tua trasformazione sotto forma di query SQL. Per ulteriori informazioni, consulta Utilizzo di una query SQL per trasformare i dati.

23 marzo 2021

Supporto per la creazione di flussi di lavoro dagli schemi (anteprima pubblica)

(Anteprima pubblica) Sono state aggiunte informazioni sulla codifica dei casi d'uso comuni di estrazione, trasformazione e caricamento (ETL) nei piani e sulla creazione di flussi di lavoro dai piani. Consente agli analisti di dati di creare ed eseguire facilmente processi ETL complessi. Per ulteriori informazioni, consulta Esecuzione di attività ETL complesse utilizzando gli schemi e i flussi di lavoro in AWS Glue.

22 marzo 2021

I connettori possono essere utilizzati per le destinazioni dati

Adesso è supportato l'utilizzo di un connettore personalizzato o Marketplace AWS per la destinazione dati. Per ulteriori informazioni, consulta Creazione di processi con connettori personalizzati.

15 marzo 2021

Supporto per i parametri sull'importanza delle colonne per le trasformazioni di machine learning AWS Glue

Aggiunte informazioni sulla visualizzazione delle metriche relative all'importanza delle colonne quando si lavora con le trasformazioni basate su machine learning AWS Glue. Per ulteriori informazioni, consulta Operare con le trasformazioni basate su machine learning nella console di AWS Glue

5 febbraio 2021

La pianificazione dei processi è ora disponibile in AWS Glue Studio

È possibile definire una pianificazione basata sul tempo per le esecuzioni del processo in AWS Glue Studio. È possibile utilizzare la console per creare una pianificazione di base o definire una pianificazione più complessa utilizzando la sintassi cron di tipo Unix. Per ulteriori informazioni, consulta Pianificazione delle esecuzioni.

21 dicembre 2020

Rilascio di AWS Glue Custom Connectors

AWS Glue Custom Connectors ti consente di scoprire e sottoscrivere i connettori in Marketplace AWS. Abbiamo anche rilasciato le interfacce del runtime di Spark AWS Glue per collegare connettori creati per origine dati Apache Spark, query federata Athena e API JDBC. Per ulteriori informazioni, consulta Utilizzo di connettori e connessioni con AWS Glue Studio.

21 dicembre 2020

Supporto per l'esecuzione di processi ETL di streaming in AWS Glue versione 2.0

Aggiunte informazioni sull'esecuzione di processi ETL di streaming in Glue versione 2.0. Per ulteriori informazioni, consulta Aggiunta di processi di streaming ETL in AWS Glue.

18 dicembre 2020

Supporto per il partizionamento del carico di lavoro con esecuzione limitata

Aggiunte informazioni sull'abilitazione del partizionamento del carico di lavoro per configurare i limiti superiori della dimensione del set di dati o il numero di file elaborati nelle esecuzioni dei processi ETL. Per ulteriori informazioni, consulta Partizionamento del carico di lavoro con esecuzione limitata.

23 novembre 2020

Supporto per una gestione avanzata delle partizioni

Sono state aggiunte informazioni su come utilizzare le nuove API per aggiungere o eliminare un indice di partizione a/da una tabella esistente. Per ulteriori informazioni, consulta Utilizzo degli indici delle partizioni.

23 novembre 2020

Supporto per il registro degli schemi di AWS Glue

Sono state aggiunte informazioni sull'utilizzo del registro degli schemi di AWS Glue per l'individuazione, il controllo e l'evoluzione in modo centralizzato degli schemi. Per ulteriori informazioni, consulta Registro degli schemi di AWS Glue.

19 novembre 2020

Supporto per il formato di input Grok nei processi ETL di streaming

Aggiunte informazioni sull'applicazione dei pattern Grok alle origini di streaming, ad esempio i file di log. Per ulteriori informazioni, consulta Applicazione di pattern Grok alle sorgenti di streaming.

17 novembre 2020

Supporto per l'aggiunta di tag ai flussi di lavoro nella console AWS Glue

Sono state aggiunte informazioni sull'aggiunta di tag durante la creazione di un flusso di lavoro utilizzando la console AWS Glue. Per ulteriori informazioni, consulta Creazione e generazione di un flusso di lavoro nella console AWS Glue.

27 ottobre 2020

Supporto per le esecuzione incrementale del crawler

Aggiunte informazioni sul supporto per le esecuzioni di crawler incrementali, che eseguono il crawling solo delle cartelle Amazon S3 aggiunte dall'ultima esecuzione. Per ulteriori informazioni, consulta Crawling incrementale.

21 ottobre 2020

Supporto per il rilevamento dello schema per le origini dati ETL di streaming. supporto per le origini dei dati ETL di streaming Avro e Kafka autogestito

I processi di estrazione, trasformazione e caricamento (ETL) di streaming in AWS Glue ora possono rilevare automaticamente lo schema dei registri in entrata e gestire le modifiche dello schema per ogni registro. Sono ora supportate le origini di dati Kafka autogestite. I processi ETL di streaming ora supportano il formato Avro nelle origini dati. Per ulteriori informazioni, consulta Streaming ETL inAWS Glue, Definizione delle proprietà dell'operazione per un'operazione ETL di streaming eNote e restrizioni per le origini di streaming Avro.

7 ottobre 2020

Supporto per il crawling delle origini dei dati MongoDB e DocumentDB

Aggiunte informazioni sul supporto per il crawling delle origini dati MongoDB e Amazon DocumentDB (con compatibilità MongoDB). Per ulteriori informazioni, consulta Definizione di crawler.

5 ottobre 2020

Supporto per la conformità a FIPS

Aggiunte informazioni sugli endpoint FIPS per i clienti che necessitano di moduli crittografici convalidati FIPS 140-2 quando accedono ai dati con AWS Glue. Per ulteriori informazioni, consulta la pagina Conformità FIPS.

23 settembre 2020

AWS Glue Studio fornisce un'interfaccia visiva facile da usare per la creazione e il monitoraggio dei processi

Ora è possibile utilizzare una semplice interfaccia grafica per comporre lavori che spostano e trasformano i dati ed eseguirli su AWS Glue. È quindi possibile utilizzare il pannello di controllo di esecuzione dei processi in AWS Glue Studio per monitorare l'esecuzione di ETL e garantire che i processi funzionino come previsto. Per ulteriori informazioni, consulta la Guida per l'utente di AWS Glue Studio.

23 settembre 2020

Supporto per la creazione di indici di tabella per migliorare le prestazioni delle query

Aggiunte informazioni sulla creazione di indici di tabella per consentire il recupero di un sottoinsieme di partizioni da una tabella. Per ulteriori informazioni, consulta Utilizzo degli indici delle partizioni.

9 settembre 2020

Supporto per tempi di startup ridotti durante l'esecuzione di processi ETL di Apache Spark in AWS Glue versione 2.0.

Aggiunte informazioni sul supporto per AWS Glue versione 2.0, che fornisce un'infrastruttura aggiornata per l'esecuzione di processi ETL di Apache Spark con tempi di startup ridotti, modifiche nella registrazione e supporto per la specifica di moduli Python aggiuntivi a livello di processo. Per ulteriori informazioni, consulta Note di rilascio di AWS Glue ed Esecuzione di processi ETL Spark con tempi di avvio ridotti.

10 agosto 2020

Supporto per limitare il numero di esecuzioni simultanee del flusso di lavoro.

Aggiunte informazioni su come limitare il numero di esecuzioni simultanee per un determinato flusso di lavoro. Per ulteriori informazioni, consulta Creazione e generazione di un flusso di lavoro utilizzando la console AWS Glue.

10 agosto 2020

Supporto per il crawling di un datastore Amazon S3 utilizzando un endpoint VPC

Aggiunte informazioni sulla configurazione dell'archivio dati Amazon S3 per consentire l'accesso solo a un ambiente Amazon Virtual Private Cloud (Amazon VPC) per motivi di sicurezza, audit o controllo. Per ulteriori informazioni, consulta Crawling di un datastore Amazon S3 utilizzando un endpoint VPC.

7 agosto 2020

Supporto per la ripresa delle esecuzioni del flusso di lavoro

Aggiunte informazioni su come riprendere le esecuzioni del flusso di lavoro completate solo parzialmente perché uno o più nodi (processi o crawler) non sono stati completati correttamente. Per ulteriori informazioni, consulta Ripresa e ripristino dell'esecuzione di un flusso di lavoro.

27 luglio 2020

Supporto per l'abilitazione di certificati emessi da CA privati nelle connessioni Kafka in AWS Glue.

Aggiunte informazioni sulle nuove opzioni di connessione che supportano l'abilitazione dei certificati emessi da una CA privati per le connessioni Kafka in AWS Glue. Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue e Parametri speciali utilizzati daAWS Glue.

20 luglio 2020

Supporto per la lettura dei dati DynamoDB in un altro account

Aggiunte informazioni sul supporto AWS Glue per la lettura di dati da una tabella DynamoDB di un altro account AWS. Per ulteriori informazioni, consulta Lettura dai dati DynamoDB in un altro account.

17 luglio 2020

Supporto per una connessione al writer DynamoDB nella versione AWS Glue 1.0 o successive

Aggiunte informazioni sul supporto per il writer DynamoDB e opzioni di connessione nuove o aggiornate per la lettura o la scrittura di DynamoDB. Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue.

17 luglio 2020

Supporto per i collegamenti alle risorse e per il controllo degli accessi tra account utilizzando sia AWS Glue che Lake Formation

Aggiunti contenuti relativi a nuovi oggetti del catalogo dati denominati link alle risorse e a come gestire la condivisione delle risorse del catalogo dati tra gli account sia con AWS Glue che con AWS Lake Formation. Per ulteriori informazioni, consulta Concedere l'accesso multi-account e Link alle risorse della tabella.

7 luglio 2020

Supporto per il campionamento dei registri durante il crawling dei datastore DynamoDB

Sono state aggiunte informazioni sulle nuove proprietà che puoi configurare durante il crawling di un datastore DynamoDB. Per ulteriori informazioni, consulta Proprietà del crawler.

12 giugno 2020

Supporto per l'arresto di un'esecuzione del flusso di lavoro.

Sono state aggiunte informazioni su come interrompere l'esecuzione di un flusso di lavoro per un determinato flusso di lavoro. Per ulteriori informazioni, vedere Arresto di un'esecuzione del flusso di lavoro.

14 maggio 2020

Supporto per i processi ETL di streaming Spark

Sono state aggiunte informazioni sulla creazione di processi ETL (Extract, Transform and Load) con origini dati in streaming. Per ulteriori informazioni, consulta Aggiunta di processi di streaming ETL in AWS Glue.

27 aprile 2020

Supporto per la creazione di tabelle, l'aggiornamento dello schema e l'aggiunta di nuove partizioni nel catalogo dati dopo l'esecuzione di un processo ETL

Sono state aggiunte informazioni su come abilitare la creazione di tabelle, l'aggiornamento dello schema e l'aggiunta di nuove partizioni per visualizzare i risultati del processo ETL nel catalogo dati. Per ulteriori informazioni, consulta Creazione di tabelle, aggiornamento dello schema e aggiunta di nuove partizioni nel catalogo dati da processi ETL AWS Glue.

2 aprile 2020

Supporto per specificare una versione per il formato dati Apache Avro come input e output ETL in AWS Glue

Aggiunte informazioni su come specificare una versione per il formato dati Apache Avro come input e output ETL in AWS Glue. La versione predefinita 1.7. Puoi utilizzare l'opzione del formato version per specificare Avro versione 1.8 per abilitare la lettura/scrittura logica. Per ulteriori informazioni, consulta Opzioni di formato per gli input e output ETL in AWS Glue.

31 marzo 2020

Supporto per il committer ottimizzato EMRFS S3 per la scrittura di dati Parquet in Amazon S3

Sono state aggiunte informazioni su come impostare un nuovo flag per abilitare il committer ottimizzato EMRFR S3 per la scrittura dei dati Parquet in Amazon S3 durante la creazione o l'aggiornamento di un processo AWS Glue. Per ulteriori informazioni, consulta Parametri speciali usati da AWS Glue.

30 marzo 2020

Supporto per le trasformazioni di machine learning come risorsa gestita dai tag delle risorse AWS

Sono state aggiunte informazioni sull'utilizzo dei tag delle risorse AWS per gestire e controllare l'accesso alle trasformazioni di machine learning in AWS Glue. È possibile assegnare i tag delle risorse AWS a processi, trigger, endpoint, crawler e trasformazioni di machine learning in AWS Glue. Per ulteriori informazioni sui tag, consultare Tag AWS in AWS Glue.

2 marzo 2020

Supporto per argomenti di lavoro non sovrascrivibili

Aggiunte informazioni sul supporto per parametri di lavoro speciali che non possono essere sovrascritti nei trigger o quando si esegue il processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

12 febbraio 2020

Supporto per nuove trasformazioni per l'utilizzo con set di dati in Amazon S3

Sono state aggiunte informazioni sulle nuove trasformazioni (Merge, Purge e Transition) ed esclusioni delle classi di storage Amazon S3 per applicazioni Apache Spark per l'utilizzo con set di dati in Amazon S3. Per ulteriori informazioni sul supporto per queste trasformazioni per Python, mergeDynamicFrameconsulta Working with Datasets in Amazon S3. Per Scala, vedi mergeDynamicFramese le API di Scala. AWS Glue GlueContext

16 gennaio 2020

Supporto per l'aggiornamento del Catalogo Dati con nuove informazioni di partizione da un processo ETL

Sono state aggiunte informazioni su come codificare uno script di estrazione, trasformazione e caricamento (ETL) per aggiornare AWS Glue Data Catalog con le nuove informazioni sulla partizione. Con questa caratteristica, non è più necessario eseguire nuovamente il crawler al termine del processo per visualizzare le nuove partizioni. Per ulteriori informazioni, consulta Aggiornamento del catalogo dati con nuove partizioni.

15 gennaio 2020

Nuovo tutorial: usare un notebook SageMaker

È stato aggiunto un tutorial che dimostra come usare un SageMaker notebook Amazon per aiutarti a sviluppare i tuoi script ETL e di machine learning. Vedi il tutorial: Usa un Amazon SageMaker Notebook con il tuo endpoint di sviluppo.

3 gennaio 2020

Supporto per la lettura da MongoDB e Amazon DocumentDB (compatibile con MongoDB)

Aggiunte informazioni sui nuovi tipi di connessione e opzioni di connessione per leggere e scrivere su MongoDB e Amazon DocumentDB (con compatibilità MongoDB). Per ulteriori informazioni, consulta Tipi di connessione e opzioni per ETL in AWS Glue.

17 dicembre 2019

Varie correzioni e chiarimenti

Sono state aggiunte diverse correzioni e chiarimenti. Sono state rimosse delle voci dal capitolo Problemi noti. Sono stati aggiunti avvisi indicanti che AWS Glue supporta solo le chiavi master del cliente (CMK) simmetriche quando si specificano le impostazioni di crittografia di catalogo dati e si creano configurazioni di sicurezza. Aggiunta una nota indicante che AWS Glue non supporta la scrittura in Amazon DynamoDB.

9 dicembre 2019

Supporto per driver JDBC personalizzati

Aggiunte informazioni sulla connessione a origini dati e destinazioni con driver JDBC non supportate da AWS Glue in modo nativo, ad esempio MySQL versione 8 e Oracle Database versione 18. Per ulteriori informazioni, vedere Valori JDBC ConnectionType.

25 novembre 2019

Support per il collegamento di SageMaker notebook a diversi endpoint di sviluppo

Sono state aggiunte informazioni su come collegare un SageMaker notebook a diversi endpoint di sviluppo. Aggiornamenti per descrivere la nuova azione della console per il passaggio a un nuovo endpoint di sviluppo e la nuova SageMaker policy IAM. Per ulteriori informazioni, consulta Working with Notebooks on the AWS Glue Console e Creazione di una policy IAM per Amazon Notebooks. SageMaker

21 novembre 2019

Supporto per la versione AWS Glue nelle trasformazioni di machine learning

Sono state aggiunte informazioni sulla definizione della versione AWS Glue in una trasformazione di machine learning per indicare la versione di AWS Glue con cui è compatibile una trasformazione di machine learning. Per ulteriori informazioni, consulta Operare con le trasformazioni basate su machine learning nella console di AWS Glue.

21 novembre 2019

Supporto per il riavvolgimento dei segnalibri di processo

Sono state aggiunte informazioni sul riavvolgimento dei segnalibri di processo per qualsiasi esecuzione precedente, con conseguente rielaborazione dei dati dell'esecuzione del processo successivo solo dall'esecuzione del processo con il segnalibro. Sono descritte due nuove opzioni secondarie per l'opzione job-bookmark-pause che consentono di eseguire un processo tra due segnalibri. Per ulteriori informazioni, consulta Monitoraggio dei dati elaborati mediante segnalibri di processo e Parametri speciali usati da AWS Glue.

22 ottobre 2019

Supporto per certificati JDBC personalizzati per la connessione a un archivio dati

Sono state aggiunte informazioni sul supporto AWS Glue di certificati JDBC personalizzati per connessioni SSL a origini dati o destinazioni AWS Glue. Per ulteriori informazioni, consulta Uso di connessioni nella console AWS Glue.

10 ottobre 2019

Supporto per Python wheel

Sono state aggiunte informazioni sul supporto AWS Glue di file wheel (insieme ai file egg) come dipendenze per processi shell di Python. Per ulteriori informazioni, consulta Fornire la propria libreria Python.

26 settembre 2019

Supporto per il controllo delle versioni di endpoint di sviluppo in AWS Glue

Sono state aggiunte informazioni sulla definizione di Glue version negli endpoint di sviluppo. Glue version determina le versioni di Apache Spark e Python supportate da AWS Glue. Per ulteriori informazioni, consulta Aggiunta di un endpoint di sviluppo.

19 settembre 2019

Supporto per il monitoraggio di AWS Glue tramite l'interfaccia utente di Spark

Sono state aggiunte informazioni sull'utilizzo dell'interfaccia utente di Apache Spark per monitorare ed eseguire il debug di processi ETL AWS Glue in esecuzione sul sistema di processi AWS Glue e applicazioni Spark negli su endpoint di sviluppo AWS Glue. Per ulteriori informazioni, consulta Monitoraggio di AWS Glue mediante l'interfaccia utente di Spark.

19 settembre 2019

Miglioramento del supporto per lo sviluppo di script ETL locali tramite la libreria ETL AWS Glue pubblica

È stato aggiornato il contenuto della libreria ETL AWS Glue per riflettere che AWS Glue versione 1.0 è ora supportata. Per ulteriori informazioni, consulta Sviluppo e test di script ETL in locale tramite la libreria ETL di AWS Glue.

18 settembre 2019

Supporto per l'esclusione delle classi di archiviazione Amazon S3 durante l'esecuzione di processi

Aggiunte informazioni sull'esclusione delle classi di storage Amazon S3 durante l'esecuzione di processi ETL AWS Glue che leggono file o partizioni da Amazon S3. Per ulteriori informazioni, consulta Esclusione delle classi di storage Amazon S3.

29 agosto 2019

Supporto per lo sviluppo di script ETL locali tramite la libreria ETL AWS Glue pubblica

Aggiunte informazioni su come sviluppare e testare script ETL Python e Scala in locale senza la necessità di una connessione di rete. Per ulteriori informazioni, consulta Sviluppo e test di script ETL in locale tramite la libreria ETL di AWS Glue.

28 agosto 2019

Problemi noti

Sono state aggiunte informazioni sui problemi noti in AWS Glue. Per ulteriori informazioni, consulta Problemi noti per AWS Glue.

28 agosto 2019

Supporto per le trasformazioni di machine learning in AWS Glue

Sono state aggiunte informazioni sulle caratteristiche di machine learning fornite da AWS Glue per creare trasformazioni personalizzate. È possibile creare queste trasformazioni al momento della creazione di un processo. Per ulteriori informazioni, consulta Trasformazioni basate su machine learning in AWS Glue.

8 agosto 2019

Supporto per Amazon Virtual Private Cloud condiviso

Aggiunte informazioni sul supporto AWS Glue per Amazon Virtual Private Cloud condiviso. Per ulteriori informazioni, consulta VPC Amazon condivisi.

6 agosto 2019

Supporto per il controllo delle versioni in AWS Glue

Sono state aggiunte informazioni sulla definizione di Glue version nelle proprietà del processo. AWS Glue determina le versioni di Apache Spark e Python supportate da AWS Glue. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

24 luglio 2019

Supporto per le opzioni di configurazione aggiuntive per gli endpoint di sviluppo

Sono state aggiunte informazioni sulle opzioni di configurazione per gli endpoint di sviluppo con carichi di lavoro intensi in termini di memoria. È possibile scegliere tra due nuove configurazioni che offrono maggiore quantità di memoria per esecutore. Per ulteriori informazioni, consulta Uso di endpoint di sviluppo nella console AWS Glue.

24 luglio 2019

Supporto per l'esecuzione di attività di estrazione, trasformazione e caricamento (ETL) utilizzando i flussi di lavoro

Aggiunte informazioni sull'utilizzo di un nuovo costrutto denominato flusso di lavoro per progettare un'attività complessa multiprocesso di estrazione, trasformazione e caricamento (ETL) che AWS Glue è in grado di eseguire e monitorare come una singola entità. Per ulteriori informazioni, consulta Esecuzione di attività ETL complesse utilizzando i flussi di lavoro in AWS Glue.

20 giugno 2019

Supporto per Python 3.6 in processi shell di Python

Sono state aggiunte informazioni sul supporto di Python 3.6 in processi shell di Python. Puoi specificare Python 2.7 o Python 3.6 come proprietà di un processo. Per ulteriori informazioni, consulta Aggiunta di processi shell di Python in AWS Glue.

5 giugno 2019

Supporto di endpoint di cloud privato virtuale (VPC, Virtual Private Cloud)

Sono state aggiunte informazioni sulla connessione diretta ad AWS Glue attraverso un endpoint di interfaccia nel VPC. Quando si utilizza un endpoint VPC di interfaccia, la comunicazione tra il VPC e AWS Glue avviene in modo completo e sicuro all'interno della rete AWS. Per ulteriori informazioni, consulta la pagina relativa all'utilizzo di AWS Glue con endpoint VPC.

4 giugno 2019

Supporto per la registrazione continua in tempo reale per processi AWS Glue.

Sono state aggiunte informazioni sull'attivazione e la visualizzazione dei log dei job di Apache Spark in tempo reale, CloudWatch tra cui i log dei driver, i log di ogni executor e una barra di avanzamento dei job Spark. Per ulteriori informazioni, consulta l'articolo relativo alla registrazione continua dei processi AWS Glue.

28 maggio 2019

Supporto per le tabelle del Catalogo Dati esistenti come origini crawler

Sono state aggiunte informazioni su come specificare un elenco di tabelle del catalogo dati esistenti come origini crawler. I crawler possono quindi rilevare le modifiche agli schemi di tabella, aggiornare le definizioni di tabella e registrare nuove partizioni quando i nuovi dati diventano disponibili. Per ulteriori informazioni, consulta Proprietà dei crawler.

10 maggio 2019

Supporto per le opzioni di configurazione aggiuntive per i processi con elevati requisiti di memoria

Sono state aggiunte informazioni sulle opzioni di configurazione per i processi Apache Spark con carichi di lavoro con elevati requisiti di memoria. È possibile scegliere tra due nuove configurazioni che offrono maggiore quantità di memoria per esecutore. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

5 aprile 2019

Supporto per classificatori CSV personalizzati

Sono state aggiunte informazioni sull'utilizzo di un classificatore CSV personalizzato per dedurre lo schema di vari tipi di dati CSV. Per ulteriori informazioni, consulta Scrittura di classificatori personalizzati.

26 marzo 2019

Supporto per i tag delle risorse AWS

Sono state aggiunte informazioni sull'utilizzo dei tag delle risorse AWS per gestire e controllare l'accesso alle risorse AWS Glue. È possibile assegnare i tag delle risorse AWS a processi, trigger, endpoint e crawler in AWS Glue. Per ulteriori informazioni sui tag, consultare Tag AWS in AWS Glue.

20 marzo 2019

Supporto del Catalogo Dati per i processi Spark SQL

Sono state aggiunte informazioni sulla configurazione dei processi e degli endpoint di sviluppo di AWS Glue per usare AWS Glue Data Catalog come metastore Apache Hive esterno. In questo modo i processi e gli endpoint di sviluppo eseguono le query Apache Spark SQL direttamente sulle tabelle archiviate in AWS Glue Data Catalog. Per ulteriori informazioni, consulta l'argomento relativo al AWS Glue Data Catalogsupporto di per i processi Spark SQL.

14 marzo 2019

Supporto per processi shell di Python

Aggiunte informazioni sui processi shell di Python e il nuovo campo Maximum capacity (Capacità massima). Per ulteriori informazioni, consulta l'argomento relativo all'aggiunta di processi shell di Python in AWS Glue.

18 gennaio 2019

Supporto per le notifiche quando sono presenti modifiche di database e di tabelle

Aggiunte informazioni sugli eventi generati a causa di modifiche al database, alla tabella e alle chiamate all'API della partizione. È possibile configurare le azioni in Eventi per rispondere a questi eventi CloudWatch . Per ulteriori informazioni, consulta Automazione AWS Glue con CloudWatch eventi.

16 gennaio 2019

Supporto per la crittografia delle password di connessione

Aggiunte informazioni sulla crittografia di password utilizzate in oggetti di connessione. Per ulteriori informazioni, consulta Crittografia delle password di connessione.

11 dicembre 2018

Supporto per le autorizzazioni a livello della risorsa e per le policy basate sulla risorsa

Aggiunte informazioni sull'utilizzo di autorizzazioni a livello della risorsa e delle policy basate sulla risorsa con AWS Glue. Per ulteriori informazioni, consulta gli argomenti indicati in Sicurezza in AWS Glue.

15 ottobre 2018

Support per SageMaker notebook

Sono state aggiunte informazioni sull'utilizzo di SageMaker notebook con endpoint di sviluppo. AWS Glue Per ulteriori informazioni, consulta Gestione di notebook.

5 ottobre 2018

Supporto per la crittografia

Aggiunta di informazioni sull'uso della crittografia con AWS Glue. Per ulteriori informazioni, consulta Crittografia dei dati inattivi, Crittografia dei dati in transito e Configurazione della crittografia in AWS Glue.

24 agosto 2018

Supporto per i parametri di processo Apache Spark

Aggiunta di informazioni sull'uso dei parametri Apache Spark per migliorare il debug e la profilatura dei processi ETL. È possibile tenere facilmente traccia dei parametri di runtime come i byte letti e scritti, l'uso della memoria e il carico della CPU del driver e degli executor, nonché la distribuzione dei dati tra executor dalla console AWS Glue. Per ulteriori informazioni, consulta Monitoring AWS Glue Using CloudWatch Metrics, Job Monitoring and Debugging e Working with Jobs on the Console. AWS Glue

13 luglio 2018

Supporto di DynamoDB come origine dati

Aggiunta di informazioni sul crawling di DynamoDB e su come usarlo come origine dati dei processi ETL. Per ulteriori informazioni, consulta Catalogazione di tabelle con un crawler e Parametri di connessione.

10 luglio 2018

Aggiornamenti alla procedura di creazione di un server notebook

Aggiornamento delle informazioni su come creare un server notebook in un'istanza Amazon EC2 associata a un endpoint di sviluppo. Per ulteriori informazioni, consulta Creazione di un server notebook associato a un endpoint di sviluppo.

9 luglio 2018

Aggiornamenti ora disponibili tramite RSS

È ora possibile abbonarsi a un feed RSS per ricevere notifiche sugli aggiornamenti alla Guida per gli sviluppatori di AWS Glue.

25 giugno 2018

Supporto delle notifiche di ritardo per i processi

Aggiunte informazioni sulla configurazione di una soglia di ritardo durante l'esecuzione di un processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

25 maggio 2018

Configurazione di un crawler per aggiungere nuove colonne

Sono state aggiunte informazioni sulla nuova opzione di configurazione per i crawler,. MergeNewColumns Per maggiori informazioni, consulta Configurazione di un crawler.

7 maggio 2018

Supporto del timeout dei processi

Aggiunte informazioni sull'impostazione di una soglia di timeout durante l'esecuzione di un processo. Per ulteriori informazioni, consulta Aggiunta di processi in AWS Glue.

10 aprile 2018

Supporto script Scala ETL e processi trigger basati su stati di esecuzione aggiuntivi

Informazioni aggiunte sull'utilizzo di Scala come linguaggio di programmazione ETL. Ora l'API trigger supporta anche l'attivazione se viene soddisfatta una qualsiasi delle condizioni (in aggiunta a tutte le condizioni). Inoltre, i processi possono essere attivati sulla base di un'esecuzione processo "non riuscita" o "arrestata" (in aggiunta a un'esecuzione processo "riuscita").

12 gennaio 2018

Aggiornamenti precedenti

La tabella seguente descrive le modifiche importanti apportate in ogni versione della Guida per sviluppatori AWS Glue prima di gennaio 2018.

Modifica Descrizione Data
Supporto origini dati XML e nuova opzione di configurazione crawler Informazioni aggiunte sulla classificazione di origini dati XML e nuova opzione crawler per modifiche della partizione. 16 novembre 2017
Nuove trasformazioni, supporto per motori di database Amazon RDS aggiuntivi e miglioramenti degli endpoint di sviluppo Informazioni aggiunte sulle trasformazioni di filtraggio e mappatura, supporto per Amazon RDS Microsoft SQL Server e Amazon RDS Oracle e nuove caratteristiche per gli endpoint di sviluppo. 29 settembre 2017
Versione iniziale di AWS Glue Questa è la versione iniziale della Guida per gli sviluppatori di AWS Glue. 14 agosto 2017