Adicionar uma JDBC conexão usando seus próprios JDBC drivers - AWS Glue

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Adicionar uma JDBC conexão usando seus próprios JDBC drivers

Você pode usar seu próprio JDBC driver ao usar uma JDBC conexão. Quando o driver padrão utilizado pelo AWS Glue rastreador não consegue se conectar a um banco de dados, você pode usar seu próprio driver. JDBC Por exemplo, se você quiser usar SHA -256 com seu banco de dados Postgres, e os drivers postgres mais antigos não suportam isso, você pode usar seu próprio driver. JDBC

Fontes de dados compatíveis

Fontes de dados compatíveis Fontes de dados não compatíveis
Meu SQL Snowflake
Postgres
Oracle
Redshift
SQLServidor
Aurora*

*Compatível se o JDBC driver nativo estiver sendo usado. Nem todos os recursos do driver podem ser aproveitados.

Adicionar um JDBC driver a uma JDBC conexão

nota

Se você optar por trazer suas próprias versões de JDBC driver, AWS Glue os rastreadores consumirão recursos em AWS Glue trabalhos e buckets do Amazon S3 para garantir que o driver fornecido seja executado em seu ambiente. O uso adicional de recursos será refletido em sua conta. O custo dos crawlers e trabalhos do AWS Glue se enquadram na categoria do AWS Glue para cobrança. Além disso, fornecer seu próprio JDBC driver não significa que o rastreador seja capaz de aproveitar todos os recursos do driver.

Para adicionar seu próprio JDBC driver a uma JDBC conexão:
  1. Adicione o arquivo do JDBC driver a um local do Amazon S3. Você pode criar um bucket e/ou uma pasta ou usar os já existentes.

  2. No console do AWS Glue, escolha Conexões no menu à esquerda em Catálogo de dados e crie uma nova conexão.

  3. Preencha os campos das Propriedades da conexão e escolha JDBC o tipo de conexão.

  4. Em Acesso à conexão, insira o nome JDBCURLe a classe do JDBC motoristaopcional. O nome da classe do driver deve ser para uma fonte de dados compatível com os crawlers do AWS Glue.

    A captura de tela mostra uma fonte de dados JDBC selecionada e uma conexão na janela Adicionar fonte de dados.
  5. Escolha o caminho do Amazon S3 em que o JDBC motorista está localizado no campo JDBCDriver Amazon S3 Path — opcional.

  6. Preencha os campos de Tipo de credencial se estiver inserindo um nome de usuário e senha ou segredo. Ao concluir, escolha Criar conexão.

    nota

    O teste de conexão não é compatível atualmente. Ao rastrear a fonte de dados com um JDBC driver que você forneceu, o rastreador pula essa etapa.

  7. Adicione a conexão recém-criada a um crawler. No console do AWS Glue, escolha Crawlers no menu esquerdo em Catálogo de dados e crie um novo crawler.

  8. No assistente Adicionar crawler, na etapa 2, escolha Adicionar uma fonte de dados.

    A captura de tela mostra uma fonte de dados JDBC selecionada e uma conexão na janela Adicionar fonte de dados.
  9. Escolha JDBCcomo fonte de dados e escolha a conexão que foi criada nas etapas anteriores. Concluído

  10. Para usar seu próprio JDBC driver com um AWS Glue rastreador, adicione as seguintes permissões à função usada pelo rastreador:

    • Conceda permissões para as seguintes ações: CreateJob, DeleteJob, GetJob, GetJobRun, StartJobRun.

    • Conceda permissões para IAM ações: iam:PassRole

    • Conceda permissões para as ações do Amazon S3: s3:DeleteObjects, s3:GetObject, s3:ListBucket, s3:PutObject.

    • Conceda acesso principal do serviço ao bucket/pasta na política. IAM

    Exemplo IAM de política:

    { "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": [ "s3:PutObject", "s3:GetObject", "s3:ListBucket", "s3:DeleteObject" ], "Resource": [ "arn:aws:s3:::bucket-name/driver-parent-folder/driver.jar", "arn:aws:s3:::bucket-name" ] } ] }
  11. Se você estiver usando umVPC, você deve permitir o acesso ao AWS Glue endpoint criando o endpoint da interface e adicionando-o à sua tabela de rotas. Para obter mais informações, consulte Criação de um VPC endpoint de interface para AWS Glue

  12. Se você estiver usando criptografia em seu catálogo de dados, crie o endpoint da AWS KMS interface e adicione-o à sua tabela de rotas. Para obter mais informações, consulte Criação de um VPC endpoint para AWS KMS.