Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Riferimento alle classi di schema AWS Glue
Le librerie per i piani AWS Glue definiscono tre classi da utilizzare nello script di layout del flusso di lavoro: Job
, Crawler
e Workflow
.
Classe di processo
La classe Job
rappresenta un processo ETL AWS Glue.
Argomenti dei costruttori obbligatori
Di seguito sono illustrati gli argomenti dei costruttori obbligatori per la classe di Job
.
Nome argomento | Type (Tipo) | Descrizione |
---|---|---|
Name |
str |
Nome da assegnare al processo. AWS Glue aggiunge un suffisso generato casualmente al nome per distinguere il processo da quelli creati da altre esecuzioni del progetto. |
Role |
str |
L'Amazon Resource Name (ARN) del ruolo che deve assumere il processo durante l'esecuzione. |
Command |
dict |
Comando del processo, come specificato nella documentazione API in JobCommand struttura. |
Argomenti dei costruttori facoltativi
Di seguito sono illustrati gli argomenti dei costruttori facoltativi per la classe di Job
.
Nome argomento | Type (Tipo) | Descrizione |
---|---|---|
DependsOn |
dict |
Elenco delle entità del flusso di lavoro da cui dipende il processo. Per ulteriori informazioni, consulta Utilizzo dell'argomento DependsOn. |
WaitForDependencies |
str |
Indica se il processo deve attendere fino a che tutte le entità da cui dipende sono complete prima dell'esecuzione o fino a quando è completa una qualsiasi. Per ulteriori informazioni, consulta Utilizzo dell'argomento WaitForDependencies. Ometti se il processo dipende da una sola entità. |
(Proprietà processo) | - | Qualsiasi proprietà del processo elencate in Struttura del processo nella documentazione API AWS Glue (eccetto CreatedOn e LastModifiedOn ). |
Classe di crawler
La classe Crawler
rappresenta un crawler AWS Glue.
Argomenti dei costruttori obbligatori
Di seguito sono illustrati gli argomenti dei costruttori obbligatori per la classe di Crawler
.
Nome argomento | Type (Tipo) | Descrizione |
---|---|---|
Name |
str |
Nome da assegnare al crawler. AWS Glue aggiunge un suffisso generato casualmente al nome per distinguere il crawler da quelli creati da altre esecuzioni del progetto. |
Role |
str |
ARN del ruolo che il crawler deve assumere durante l'esecuzione. |
Targets |
dict |
Raccolta di destinazioni da sottoporre al crawling. Gli argomenti dei costruttori della classe Targets sono definiti in CrawlerTargets struttura nella documentazione API. Tutti gli argomenti dei costruttori Targets sono facoltativi, ma è necessario passarne almeno uno. |
Argomenti dei costruttori facoltativi
Di seguito sono illustrati gli argomenti dei costruttori facoltativi per la classe di Crawler
.
Nome argomento | Type (Tipo) | Descrizione |
---|---|---|
DependsOn |
dict |
Elenco delle entità del flusso di lavoro da cui dipende il crawler. Per ulteriori informazioni, consulta Utilizzo dell'argomento DependsOn. |
WaitForDependencies |
str |
Indica se il crawler deve attendere fino a che tutte le entità da cui dipende sono complete prima dell'esecuzione o fino a quando è completa una qualsiasi. Per ulteriori informazioni, consulta Utilizzo dell'argomento WaitForDependencies. Ometti se il crawler dipende da una sola entità. |
(Proprietà dei crawler) | - | Qualsiasi proprietà del crawler elencata in Struttura dei crawler nella documentazione API AWS Glue, con le seguenti eccezioni:
|
Classe di flusso di lavoro
La classe Workflow
rappresenta un flusso di lavoro AWS Glue. Lo script layout del flusso di lavoro restituisce un Workflow
. AWS Glue crea un flusso di lavoro basato su questo oggetto.
Argomenti dei costruttori obbligatori
Di seguito sono illustrati gli argomenti dei costruttori obbligatori per la classe di Workflow
.
Nome argomento | Type (Tipo) | Descrizione |
---|---|---|
Name |
str |
Nome da assegnare al flusso di lavoro. |
Entities |
Entities |
Insieme di entità (processi e crawler) da includere nel flusso di lavoro. Il costruttore di classi Entities accetta un argomento Jobs , che è un elenco di oggetti Job e un argomento Crawlers , che è un elenco di oggetti Crawler . |
Argomenti dei costruttori facoltativi
Di seguito sono illustrati gli argomenti dei costruttori facoltativi per la classe di Workflow
.
Nome argomento | Type (Tipo) | Descrizione |
---|---|---|
Description |
str |
Per informazioni, consultare Struttura flusso di lavoro. |
DefaultRunProperties |
dict |
Per informazioni, consultare Struttura flusso di lavoro. |
OnSchedule |
str |
Un'espressione cron . |
Metodi di classe
Tutte e tre le classi includono i seguenti metodi.
- validate()
-
Convalida le proprietà dell'oggetto e, se vengono rilevati errori, genera un messaggio ed esce. Non genera alcun output se non ci sono errori. Per la classe di
Workflow
, si richiama su ogni entità nel flusso di lavoro. - to_json()
-
Serializza l'oggetto in JSON. Chiama anche
validate()
. Per la classe diWorkflow
, l'oggetto JSON include elenchi di processi e crawler e un elenco di trigger generati dalle specifiche di dipendenza del processo e del crawler.