Usa la console Athena per connetterti a un'origine dati - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Usa la console Athena per connetterti a un'origine dati

Per scegliere, assegnare un nome e distribuire un connettore origine dati, utilizza le console Athena e Lambda in un processo integrato.

Per distribuire un connettore origine dati
  1. Apri la console Athena all'indirizzo https://console.aws.amazon.com/athena/.

  2. Se il pannello di navigazione della console non è visibile, scegli il menu di espansione a sinistra.

    Scegli il menu di espansione.
  3. Nel pannello di navigazione scegli Data sources (Origini dati).

  4. Nella pagina Data sources (Origini dati), scegli Create data source (Crea origine dati).

  5. In Choose a data source (Scegli un'origine dati), scegli l'origine dati su cui eseguire una query con Athena, tenendo conto delle seguenti linee guida:

    • Scegli un'opzione di query federata che corrisponde all'origine dati. Athena dispone di connettori di origine dati predefiniti che puoi configurare per sorgenti tra cui My, Amazon SQL DocumentDB e Postgre. SQL

    • Scegli AWS Glue Data Catalog- S3 se desideri interrogare i dati in Amazon S3 senza utilizzare un metastore Apache Hive o una delle altre opzioni di origine dati di query federate in questa pagina. Athena utilizza AWS Glue Data Catalog per archiviare i metadati e le informazioni sullo schema per le origini dati in Amazon S3. Si tratta dell'opzione di default (non federata). Per ulteriori informazioni, consulta Utilizzalo AWS Glue per connettere Athena ai tuoi dati in Amazon S3.

    • Scegli S3 - Apache Hive metastore (Metastore Apache Hive - S3) per interrogare set di dati in Amazon S3 che utilizzano un metastore Apache Hive. Per ulteriori informazioni su questa opzione, consulta Connect Athena a un metastore Apache Hive.

    • Scegli Custom or shared connector (Connettore personalizzato o condiviso) se desideri creare un connettore origine dati personalizzato da utilizzare con Athena. Per informazioni sulla scrittura di un connettore origine dati, consulta Sviluppa un connettore di origine dati utilizzando Athena Query Federation SDK.

    Questo tutorial sceglie Amazon CloudWatch Logs come origine dati federata.

  6. Scegli Next (Successivo).

  7. Nella pagina Inserisci i dettagli dell'origine dati, in Nome origine dati, inserisci il nome che desideri utilizzare nelle SQL istruzioni quando esegui una query sull'origine dati da Athena (ad esempio,CloudWatchLogs). Il nome può contenere fino a 127 caratteri e deve essere univoco all'interno dell'account. Non può essere modificato dopo la creazione. I caratteri validi sono a-z, A-z, 0-9, _ (trattino basso), @ (chiocciola) e - (trattino). I nomi awsdatacatalog, hive, jmx e system sono riservati ad Athena e non possono essere utilizzati per i nomi delle origini dati.

  8. Per Lambda function (Funzione Lambda), scegli Create Lambda function (Crea funzione Lambda). La pagina delle funzioni per il connettore scelto si apre nella AWS Lambda console. La pagina include informazioni dettagliate sul connettore.

  9. Sotto Impostazioni applicazione, leggere la descrizione per ogni impostazione dell'applicazione e quindi inserire i valori corrispondenti alle proprie esigenze.

    Le impostazioni dell'applicazione visualizzate variano a seconda del connettore di origini dati. Le impostazioni minime richieste includono:

    • AthenaCatalogName— Un nome, in minuscolo, per la funzione Lambda che indica l'origine dati a cui è destinata, ad esempio. cloudwatchlogs

    • SpillBucket— Un bucket Amazon S3 nel tuo account per archiviare i dati che superano i limiti di dimensione della risposta della funzione Lambda.

      Nota

      I dati fuoriusciti non vengono riutilizzati nelle esecuzioni successive e possono essere eliminati in modo sicuro dopo 12 ore. Athena non elimina questi dati al posto tuo. Per gestire questi oggetti, prendi in considerazione l'aggiunta di una policy del ciclo di vita degli oggetti che elimina i dati precedenti dal bucket spill di Amazon S3. Per ulteriori informazioni, consulta Gestione del ciclo di vita dello storage nella Guida per l'utente di Amazon S3.

  10. Seleziona Riconosco che questa app crea IAM ruoli e politiche di risorse personalizzati. Per ulteriori informazioni, scegliere il link Info (Informazioni) .

  11. Seleziona Deploy (Implementa). Al termine dell'implementazione, la funzione Lambda viene visualizzata nella sezione Resources (Risorse) nella console Lambda.

Connessione all'origine dati

Dopo aver implementato il connettore origine dati nell'account, puoi connetterlo ad Athena.

Per eseguire la connessione di un'origine dati ad Athena utilizzando un connettore implementato nell'account
  1. Torna alla pagina Enter data source details (Inserisci i dettagli dell'origine dati) nella console Athena.

  2. Nella sezione Connection details (Dettagli di connessione), scegli l'icona di aggiornamento accanto alla casella di ricerca Select or enter a Lambda function (Seleziona o inserisci una funzione Lambda).

  3. Scegli il nome della funzione appena creata nella console Lambda. Viene ARN visualizzata la funzione Lambda.

  4. (Facoltativo) Per Tags (Tag), aggiungi coppie chiave-valore da associare a questa origine dati. Per ulteriori informazioni sui tag, consulta Tag: risorse Athena.

  5. Scegli Next (Successivo).

  6. Nella pagina Review and create (Rivedi e crea), esamina i dettagli dell'origine dati, quindi scegli Create data source (Crea origine dati).

  7. La sezione Data source details (Dettagli sull'origine dati) della pagina dell'origine dati mostra le informazioni relative al nuovo connettore. È ora possibile utilizzare il connettore nelle query Athena.

    Per informazioni sull'utilizzo di connettori dati nelle query, consulta Usa interrogazioni federate.