Usar o console do Athena - Amazon Athena

Usar o console do Athena

Para escolher, especificar um nome e implantar um conector de origem dos dados, use os consoles do Athena e do Lambda em um processo integrado.

Como implantar um conector de fonte de dados
  1. Abra o console do Athena em https://console.aws.amazon.com/athena/.

  2. Se o painel de navegação do console não estiver visível, escolha o menu de expansão à esquerda.

    Escolha o menu de expansão.
  3. No painel de navegação, escolha Origens dos dados.

  4. Na página Data sources (Origens de dados), escolha Create data source (Criar origem dos dados).

  5. Em Choose a data source (Escolher uma origem dos dados), escolha a origem dos dados que o Athena deve consultar, considerando as seguintes diretrizes:

    • Escolha uma opção de consulta federada que corresponda à sua origem dos dados. O Athena tem conectores de origem dos dados pré-criados que você pode configurar para origens que incluem o MySQL, o Amazon DocumentDB e o PostgreSQL.

    • Escolha S3 - AWS Glue Data Catalog se quiser consultar dados no Amazon S3 e não estiver usando um metastore do Apache Hive ou uma das outras opções de origem dos dados de consulta federada nesta página. O Athena usa o AWS Glue Data Catalog para armazenar metadados e informações de esquemas para origens dos dados no Amazon S3. Essa é a opção padrão (não federada). Para ter mais informações, consulte Usar o AWS Glue para se conectar a origens de dados no Amazon S3.

    • Selecione S3 - Apache Hive metastore para consultar conjuntos de dados no Amazon S3 que usam um metastore do Apache Hive. Para obter mais informações sobre essa opção, consulte Conectar o Athena a um metastore do Apache Hive.

    • Escolha Custom or shared connector (Conector personalizado ou compartilhado) se quiser criar seu próprio conector de origem dos dados para usar com o Athena. Para obter informações sobre como escrever um conector de origem dos dados, consulte Desenvolver um conector de fonte de dados usando o SDK do Athena Query Federation.

    Este tutorial escolhe o Amazon CloudWatch Logs como origem dos dados federada.

  6. Escolha Próximo.

  7. Na página Enter data source details (Inserir detalhes da origem dos dados), em Data source name (Nome da origem dos dados), insira o nome que deseja usar em suas instruções SQL ao consultar a origem dos dados pelo Athena (por exemplo, CloudWatchLogs). O nome pode ter até 127 caracteres e deve ser exclusivo na sua conta. Ele não poderá ser alterado após a criação. Os caracteres válidos são a-z, A-Z, 0-9, _ (sublinhado), @ (arroba) e - (hífen). Os nomes awsdatacatalog, hive, jmx e system são reservados pelo Athena e não podem ser usados como nomes de origens dos dados.

  8. Em Lambda function (Função do Lambda), escolha Create Lambda function (Criar função do Lambda). A página de função do conector escolhido será aberta no console do AWS Lambda. A página inclui informações detalhadas sobre o conector.

  9. Em Application settings (Configurações da aplicação), leia atentamente a descrição de cada configuração de aplicação e insira os valores de acordo com os seus requisitos.

    As configurações de aplicação exibidas variam dependendo do conector da sua origem dos dados. As configurações mínimas necessárias são:

    • AthenaCatalogName: um nome para a função do Lambda, em letras minúsculas, que indica a origem dos dados desejada, como cloudwatchlogs.

    • SpillBucket: um bucket do Amazon S3 em sua conta para armazenar os dados que excedem os limites de tamanho de resposta da função do Lambda.

      nota

      Dados derramados não são reutilizados em execuções subsequentes e podem ser excluídos com segurança depois de 12 horas. O Athena não os exclui para você. Para gerenciar esses objetos, considere adicionar uma política de ciclo de vida de objetos que exclua dados antigos do seu bucket de derramamento do Amazon S3. Para obter mais informações, consulte Gerenciar ciclo de vida de armazenamento no Manual do usuário do Amazon S3.

  10. Selecione Reconheço que este aplicativo cria perfis personalizadas do IAM e políticas de recursos. Para obter mais informações, escolha o link Informações.

  11. Escolha Implantar. Quando a implantação for concluída, a função do Lambda será exibida seção Resources (Recursos) no console do Lambda.

Conectar à fonte de dados

Depois de implantar o conector da origem dos dados em sua conta, você poderá conectar o Athena a ele.

Para conectar o Athena a uma origem dos dados usando um conector que você implantou em sua conta
  1. Retorne à página Enter data source details (Inserir detalhes da origem dos dados) do console do Athena.

  2. Na seção Connection details (Detalhes da conexão), escolha o ícone de atualização ao lado da caixa de pesquisa Select or enter a Lambda function (Selecionar ou inserir uma função do Lambda).

  3. Escolha o nome da função que você acabou de criar no console do Lambda. O ARN da função do Lambda é exibido.

  4. (Opcional) Para Tags, adicione pares de chave-valor a associar com essa origem dos dados. Para obter mais informações sobre tags, consulte Etiquetar recursos do Athena.

  5. Escolha Próximo.

  6. Na página Review and create (Revisar e criar), analise os detalhes da origem dos dados e escolha Create data source (Criar origem dos dados).

  7. A seção Data source details (Detalhes da origem dos dados) da página de sua origem dos dados mostra informações sobre o novo conector. Agora é possível usar o conector em suas consultas do Athena.

    Para obter informações sobre como usar conectores de dados em consultas, acesse Executar consultas federadas.