Aggiungere una JDBC connessione utilizzando i propri JDBC driver - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Aggiungere una JDBC connessione utilizzando i propri JDBC driver

È possibile utilizzare il proprio JDBC driver quando si utilizza una connessione. JDBC Quando il driver predefinito utilizzato dal AWS Glue crawler non è in grado di connettersi a un database, è possibile utilizzare il proprio driver. JDBC Ad esempio, se desideri utilizzare SHA -256 con il tuo database Postgres e i driver Postgres meno recenti non lo supportano, puoi utilizzare il tuo driver. JDBC

Origini dati supportate

Origini dati supportate Origini dati non supportate
Il mio SQL Snowflake
Postgres
Oracle
Redshift
SQLServer
Aurora*

*Supportato se si utilizza il JDBC driver nativo. Non è possibile avvalersi di tutte le funzionalità del driver.

Aggiungere un JDBC driver a una connessione JDBC

Nota

Se scegli di importare le tue versioni dei JDBC driver, AWS Glue i crawler consumeranno risorse in AWS Glue job e bucket Amazon S3 per garantire che il driver fornito venga eseguito nel tuo ambiente. L'utilizzo aggiuntivo delle risorse si rifletterà nel tuo account. Il costo dei crawler e dei processi AWS Glue rientra nella categoria AWS Glue in fattura. Inoltre, fornire un JDBC driver personalizzato non significa che il crawler sia in grado di sfruttare tutte le funzionalità del driver.

Per aggiungere il proprio JDBC driver a una connessione: JDBC
  1. Aggiungi il file del JDBC driver a una posizione Amazon S3. È possibile creare un bucket e/o una cartella o utilizzare un bucket e/o una cartella esistente.

  2. Nella console AWS Glue, scegli Connessioni nel menu a sinistra sotto Catalogo dati, quindi crea una nuova connessione.

  3. Compila i campi per le proprietà della connessione e scegli JDBC Tipo di connessione.

  4. In Accesso alla connessione, inserisci il nome JDBCURLe la classe del JDBC driver (facoltativo). Il nome della classe del driver deve riferirsi a un'origine dati supportata dai crawler AWS Glue.

    La schermata mostra un'origine dati JDBC selezionata e una connessione nella finestra Aggiungi origine dati.
  5. Scegli il percorso Amazon S3 in cui si trova il JDBC driver nel campo JDBCDriver Amazon S3 Path, facoltativo.

  6. Se inserisci un nome utente e una password o un segreto, completa i campi per Tipo di credenziale. Al termine, scegli Crea connessione.

    Nota

    Il test delle connessioni personalizzate non è attualmente supportato. Quando esegui la scansione dell'origine dati con un JDBC driver che hai fornito, il crawler salta questo passaggio.

  7. Aggiungi la connessione appena creata a un crawler. Nella console AWS Glue, scegli Crawler nel menu a sinistra sotto Catalogo dati, quindi crea un nuovo crawler.

  8. Nella procedura guidata Aggiungi crawler, nel passaggio 2 scegli Aggiungi un'origine dati.

    La schermata mostra un'origine dati JDBC selezionata e una connessione nella finestra Aggiungi origine dati.
  9. Scegli JDBCcome origine dati e scegli la connessione creata nei passaggi precedenti. Completa

  10. Per utilizzare il tuo JDBC driver con un AWS Glue crawler, aggiungi le seguenti autorizzazioni al ruolo utilizzato dal crawler:

    • Concedi le autorizzazioni per le seguenti operazioni di processo: CreateJob, DeleteJob, GetJob, GetJobRun, StartJobRun.

    • Concedi le autorizzazioni per le azioni: IAM iam:PassRole

    • Concedi le autorizzazioni per le operazioni di Amazon S3: s3:DeleteObjects, s3:GetObject, s3:ListBucket, s3:PutObject.

    • Concedi l'accesso principale del servizio al bucket/cartella nella policy. IAM

    Politica di esempio: IAM

    { "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": [ "s3:PutObject", "s3:GetObject", "s3:ListBucket", "s3:DeleteObject" ], "Resource": [ "arn:aws:s3:::bucket-name/driver-parent-folder/driver.jar", "arn:aws:s3:::bucket-name" ] } ] }
  11. Se si utilizza unVPC, è necessario consentire l'accesso all'AWS Glueendpoint creando l'endpoint dell'interfaccia e aggiungendolo alla tabella di routing. Per ulteriori informazioni, vedere Creazione di un endpoint di interfaccia VPC per AWS Glue

  12. Se utilizzi la crittografia nel tuo Data Catalog, crea l'endpoint di AWS KMS interfaccia e aggiungilo alla tabella di routing. Per ulteriori informazioni, consulta Creazione di un VPC endpoint per. AWS KMS