Connessioni Teradata Vantage - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Connessioni Teradata Vantage

È possibile utilizzare AWS Glue for Spark per leggere e scrivere su tabelle esistenti in Teradata Vantage in AWS Glue 4.0 e versioni successive. È possibile definire cosa leggere da Teradata con una query SQL. È possibile connettersi a Teradata utilizzando le credenziali di nome utente e password memorizzate tramite AWS Secrets Manager una connessione AWS Glue.

Per ulteriori informazioni su Teradata, consulta la documentazione di Teradata.

Configurazione delle connessioni Teradata

Per connetterti a Teradata da AWS Glue, dovrai creare e archiviare le tue credenziali Teradata in un luogo AWS Secrets Manager segreto, quindi associare quel segreto a una connessione Glue Teradata. AWS Se la tua istanza Teradata si trova in un Amazon VPC, dovrai anche fornire opzioni di rete alla tua connessione AWS Glue Teradata.

Per connettersi a Teradata da AWS Glue, potrebbero essere necessari alcuni prerequisiti:

  • Se accedi al tuo ambiente Teradata tramite Amazon VPC, configura Amazon VPC per consentire al tuo job AWS Glue di comunicare con l'ambiente Teradata. Sconsigliamo l'accesso all'ambiente Teradata tramite la rete Internet pubblica.

    In Amazon VPC, identifica o crea un VPC, una sottorete e un gruppo di sicurezza che AWS Glue utilizzerà durante l'esecuzione del lavoro. Inoltre, assicurati che Amazon VPC sia configurato per consentire il traffico di rete tra l'istanza Teradata e questa posizione. Il tuo processo dovrà stabilire una connessione TCP con la tua porta del client Teradata. Per ulteriori informazioni sulle porte Teradata, consulta la documentazione di Teradata.

    In base al layout di rete, la connettività VPC sicura potrebbe richiedere modifiche ad Amazon VPC e ad altri servizi di rete. Per ulteriori informazioni sulla AWS connettività, consulta le opzioni di AWS connettività nella documentazione di Teradata.

Per configurare una connessione AWS Glue Teradata:
  1. Nella configurazione Teradata, identifica o crea un utente e una password con cui AWS Glue si connetterà, TeraDataUser e TeraDataPassword. Per ulteriori informazioni, consulta Vantage Security Overview nella documentazione di Teradata.

  2. Nel, crea un segreto utilizzando le AWS Secrets Manager tue credenziali Teradata. Per creare un segreto in Secrets Manager, segui il tutorial disponibile in Crea un AWS Secrets Manager segreto nella AWS Secrets Manager documentazione. Dopo aver creato il segreto, prendi nota del nome, secretName, per il passaggio successivo.

    • Quando selezioni le coppie chiave/valore, crea una coppia per la chiave user con il valore teradataUsername.

    • Quando selezioni le coppie chiave/valore, crea una coppia per la chiave password con il valore teradataPassword.

  3. Nella console AWS Glue, crea una connessione seguendo i passaggi riportati di seguitoAggiunta di una connessione AWS Glue. Dopo aver creato la connessione, prendi nota del nome, connectionName, per il passaggio successivo.

    • In Tipo di connessione, seleziona Snowflake.

    • Quando fornisci JDBC URL, fornisci l'URL per la tua istanza. Puoi anche codificare determinati parametri di connessione, separati da virgole, nel tuo URL JDBC. L'URL deve rispettare il seguente formato: jdbc:teradata://teradataHostname/ParameterName=ParameterValue,ParameterName=ParameterValue

      I parametri URL supportati includono:

      • DATABASE: nome del database sull'host a cui accedere per impostazione predefinita.

      • DBS_PORT: la porta del database, utilizzata con una porta non standard.

    • Quando selezioni un tipo di credenziali, seleziona AWS Secrets Manager, quindi imposta Segreto di AWS su secretName.

  4. Nelle seguenti situazioni, potresti aver bisogno di una configurazione aggiuntiva:

    • Per le istanze Teradata ospitate su AWS un Amazon VPC

      • Dovrai fornire le informazioni di connessione Amazon VPC alla connessione AWS Glue che definisce le tue credenziali di sicurezza Teradata. Durante la creazione o l'aggiornamento della connessione, imposta VPC, sottorete e Gruppi di sicurezza nelle opzioni di rete.

Dopo aver creato una connessione AWS Glue Teradata, dovrai eseguire i seguenti passaggi prima di chiamare il metodo di connessione.

  • Concedi al ruolo IAM associato al tuo lavoro AWS Glue il permesso di leggere SecretName.

  • Nella configurazione del lavoro AWS Glue, fornisci ConnectionName come connessione di rete aggiuntiva.

Lettura da Teradata

Prerequisiti:

  • Una tabella Teradata da cui si desidera leggere. Avrai bisogno del nome della tabella, tableName.

  • Una connessione AWS Glue Teradata configurata per fornire informazioni di autenticazione. Completa i passaggi Per configurare una connessione a Teradata per configurare le informazioni di autenticazione. È necessario il nome della connessione AWS Glue, ConnectionName.

Per esempio:

teradata_read_table = glueContext.create_dynamic_frame.from_options( connection_type="teradata", connection_options={ "connectionName": "connectionName", "dbtable": "tableName" } )

Puoi anche fornire una query SQL SELECT per filtrare i risultati restituiti al tuo. DynamicFrame Sarà necessario configurare query.

Per esempio:

teradata_read_query = glueContext.create_dynamic_frame.from_options( connection_type="teradata", connection_options={ "connectionName": "connectionName", "query": "query" } )

Scrittura su tabelle Teradata

Prerequisiti: una tabella Teradata su cui scrivere, tableName. È necessario creare la tabella prima di chiamare il metodo di connessione.

Per esempio:

teradata_write = glueContext.write_dynamic_frame.from_options( connection_type="teradata", connection_options={ "connectionName": "connectionName", "dbtable": "tableName" } )

Indicazioni di riferimento alle opzioni di connessione a Teradata

  • connectionName: obbligatorio. Utilizzato per la lettura/scrittura. Il nome di una connessione AWS Glue Teradata configurata per fornire informazioni di autenticazione e di rete al metodo di connessione utilizzato.

  • dbtable — Richiesto per la scrittura, richiesto per la lettura a meno che non query sia fornito. Utilizzato per la lettura/scrittura. Il nome di una tabella con cui interagirà il metodo di connessione.

  • query: utilizzato per la lettura. Una query SELECT SQL che definisce cosa recuperare durante la lettura da Teradata.