Gmail - Amazon Kendra

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Gmail

Gmail è un client di posta elettronica sviluppato da Google attraverso il quale è possibile inviare messaggi di posta elettronica con file allegati. I messaggi di Gmail possono essere ordinati e archiviati all'interno della casella di posta elettronica utilizzando cartelle ed etichette. Puoi utilizzarli Amazon Kendra per indicizzare i messaggi di posta elettronica e gli allegati dei messaggi. È inoltre possibile Amazon Kendra configurare l'inclusione o l'esclusione di messaggi di posta elettronica, allegati di messaggi ed etichette specifici per l'indicizzazione.

Puoi connetterti Amazon Kendra alla tua fonte di dati Gmail utilizzando la Amazon Kendra console e l'API. TemplateConfiguration

Per la risoluzione dei problemi relativi al connettore di origine dati di Amazon Kendra Gmail, consulta. Risoluzione dei problemi relativi alle origini dati

Funzionalità supportate

  • Mappature dei campi

  • Controllo degli accessi degli utenti

  • Filtri di inclusione/esclusione

  • Sincronizzazione completa e incrementale dei contenuti

  • Virtual Private Cloud (VPC) (Cloud privato virtuale (VPC)

Prerequisiti

Prima di poterla utilizzare Amazon Kendra per indicizzare la tua fonte di dati Gmail, apporta queste modifiche a Gmail e agli account. AWS

In Gmail, assicurati di avere:

  • Hai creato un account amministratore di Google Cloud Platform e hai creato un progetto Google Cloud.

  • Hai attivato l'API Gmail e l'API Admin SDK nel tuo account amministratore.

  • Hai creato un account di servizio e scaricato una chiave privata JSON per Gmail. Per informazioni su come creare e accedere alla tua chiave privata, consulta la documentazione di Google Cloud su come creare una chiave di account di servizio e le credenziali dell'account di servizio.

  • Ho copiato l'email del tuo account di amministratore, l'email del tuo account di servizio e la tua chiave privata per utilizzarla come credenziali di autenticazione.

    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

  • Sono stati aggiunti i seguenti ambiti Oauth (utilizzando un ruolo di amministratore) per l'utente e le directory condivise che desideri indicizzare:

    • https://www.googleapis.com/auth/admin.directory.user.readonly

    • https://www.googleapis.com/auth/gmail.readonly

  • È stato verificato che ogni documento sia unico in Gmail e tra le altre fonti di dati che intendi utilizzare per lo stesso indice. Ogni fonte di dati che desideri utilizzare per un indice non deve contenere lo stesso documento in tutte le fonti di dati. Gli ID dei documenti sono globali rispetto a un indice e devono essere univoci per indice.

Nel tuo Account AWS, assicurati di avere:

  • Ha creato un Amazon Kendra indice e, se si utilizza l'API, ha annotato l'ID dell'indice.

  • Hai creato un IAM ruolo per la tua origine dati e, se utilizzi l'API, hai annotato l'ARN del IAM ruolo.

    Nota

    Se modifichi il tipo di autenticazione e le credenziali, devi aggiornare il IAM ruolo per accedere all'ID AWS Secrets Manager segreto corretto.

  • Ha archiviato le credenziali di autenticazione di Gmail in un AWS Secrets Manager luogo segreto e, se si utilizza l'API, ha annotato l'ARN del segreto.

    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

Se non disponi di un IAM ruolo o di un segreto esistente, puoi utilizzare la console per creare un nuovo IAM ruolo e un Secrets Manager segreto quando connetti l'origine dati di Gmail a. Amazon Kendra Se utilizzi l'API, devi fornire l'ARN di un IAM ruolo e di un Secrets Manager segreto esistenti e un ID di indice.

Istruzioni di connessione

Per connetterti Amazon Kendra alla tua fonte di dati Gmail devi fornire i dettagli delle tue credenziali di Gmail in modo da Amazon Kendra poter accedere ai tuoi dati. Se non hai ancora configurato Gmail per, consulta. Amazon KendraPrerequisiti

Console

Per connettersi Amazon Kendra a Gmail

  1. Accedi a AWS Management Console e apri la Amazon Kendra console.

  2. Dal riquadro di navigazione a sinistra, scegli Indici, quindi scegli l'indice che desideri utilizzare dall'elenco degli indici.

    Nota

    Puoi scegliere di configurare o modificare le impostazioni del controllo dell'accesso degli utenti in Impostazioni dell'indice.

  3. Nella pagina Guida introduttiva, scegli Aggiungi origine dati.

  4. Nella pagina Aggiungi origine dati, scegli Connettore Gmail, quindi scegli Aggiungi connettore. Se utilizzi la versione 2 (se applicabile), scegli il connettore Gmail con il tag «V2.0".

  5. Nella pagina Specificare i dettagli dell'origine dati, inserisci le seguenti informazioni:

    1. In Nome e descrizione, per Nome dell'origine dati, inserisci un nome per l'origine dati. Puoi includere trattini ma non spazi.

    2. (Facoltativo) Descrizione: immetti una descrizione facoltativa per l'origine dati.

    3. In Lingua predefinita: scegli una lingua per filtrare i documenti per l'indice. Se non diversamente specificato, la lingua predefinita è l'inglese. La lingua specificata nei metadati del documento ha la precedenza sulla lingua selezionata.

    4. In Tag, per Aggiungi nuovo tag, includi tag opzionali per cercare e filtrare le risorse o tenere traccia dei costi. AWS

    5. Seleziona Successivo.

  6. Nella pagina Definisci accesso e sicurezza, inserisci le seguenti informazioni:

    1. Autorizzazione: attiva o disattiva le informazioni dell'elenco di controllo degli accessi (ACL) per i tuoi documenti, se disponi di un ACL e desideri utilizzarlo per il controllo degli accessi. L'ACL specifica a quali documenti possono accedere utenti e gruppi. Le informazioni ACL vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.

    2. In Autenticazione AWS Secrets Manager segreta: scegli un segreto esistente o creane uno nuovo per archiviare le Secrets Manager credenziali di autenticazione di Gmail. Se scegli di creare un nuovo segreto, si apre una finestra AWS Secrets Manager segreta.

      1. Inserisci le seguenti informazioni nella finestra Crea un AWS Secrets Manager segreto:

        1. Nome segreto: un nome per il tuo segreto.

        2. Email del client: l'email del client che hai copiato dal tuo account di servizio Google.

        3. Email dell'account amministratore: l'email dell'account amministratore che desideri utilizzare.

        4. Chiave privata: la chiave privata che hai copiato dal tuo account di servizio Google.

        5. Salva e aggiungi il tuo segreto.

    3. Virtual Private Cloud (VPC): puoi scegliere di utilizzare un VPC. In tal caso, è necessario aggiungere sottoreti e gruppi di sicurezza VPC.

    4. IAM ruolo: scegli un IAM ruolo esistente o creane uno nuovo IAM per accedere alle credenziali del repository e indicizzare il contenuto.

      Nota

      IAM i ruoli utilizzati per gli indici non possono essere utilizzati per le fonti di dati. Se non sei sicuro che un ruolo esistente venga utilizzato per un indice o una FAQ, scegli Crea un nuovo ruolo per evitare errori.

    5. Seleziona Successivo.

  7. Nella pagina Configura le impostazioni di sincronizzazione, inserisci le seguenti informazioni:

    1. Per i tipi di entità: scegli di sincronizzare gli allegati dei messaggi.

    2. (Facoltativo) Per la configurazione aggiuntiva, inserisci le seguenti informazioni:

      1. Intervallo di date: inserisci un intervallo di date per specificare la data di inizio e di fine delle e-mail che desideri sottoporre a scansione.

      2. Domini e-mail: include o esclude determinate e-mail in base ai domini e-mail «to», «from», «cc» e «bcc».

      3. Parole chiave nell'oggetto: include o esclude le e-mail in base a parole chiave nell'oggetto delle e-mail.

        Nota

        Puoi anche scegliere di includere tutti i documenti che corrispondono a tutte le parole chiave dell'oggetto che hai inserito.

      4. Etichette: aggiungi modelli di espressioni regolari per includere o escludere determinate etichette di posta elettronica.

      5. Allegati: aggiungi modelli di espressioni regolari per includere o escludere determinati allegati di posta elettronica.

    3. Modalità di sincronizzazione: scegli come aggiornare l'indice quando il contenuto dell'origine dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione.

      • Sincronizzazione completa: indicizza di nuovo tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

      • Sincronizzazione nuova, modificata ed eliminata: indicizza solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

      Importante

      Poiché non esiste un'API per aggiornare i messaggi Gmail eliminati definitivamente, né per la sincronizzazione dei contenuti nuovi, modificati o eliminati:

      • Non rimuoverà dal tuo indice i messaggi eliminati definitivamente da Gmail Amazon Kendra

      • Non sincronizzerà le modifiche nelle etichette delle email di Gmail

      Per sincronizzare le modifiche alle etichette delle sorgenti dati di Gmail e i messaggi email eliminati definitivamente con il tuo Amazon Kendra indice, devi eseguire periodicamente ricerche per indicizzazione complete.

    4. Nella pianificazione di esecuzione della sincronizzazione, per Frequenza, scegli la frequenza con cui sincronizzare il contenuto della fonte di dati e aggiornare l'indice.

    5. Seleziona Successivo.

  8. Nella pagina Imposta mappature dei campi, inserisci le seguenti informazioni:

    1. Campi di origine dati predefiniti: seleziona uno dei campi di origine dati predefiniti Amazon Kendra generati che desideri mappare all'indice.

      Nota

      Amazon Kendra Il connettore di origine dati di Gmail non supporta la creazione di campi indice personalizzati a causa delle limitazioni dell'API.

    2. Seleziona Successivo.

  9. Nella pagina Rivedi e crea, verifica che le informazioni inserite siano corrette, quindi seleziona Aggiungi origine dati. Puoi anche scegliere di modificare le tue informazioni da questa pagina. L'origine dati verrà visualizzata nella pagina Origini dati dopo che l'origine dati sarà stata aggiunta correttamente.

API

Per connettersi Amazon Kendra a Gmail

È necessario specificare un codice JSON dello schema dell'origine dati utilizzando l'TemplateConfigurationAPI. È necessario fornire le seguenti informazioni:

  • Origine dati: specifica il tipo di origine dati come GMAIL quando usi lo schema TemplateConfigurationJSON. Specificate anche l'origine dati come TEMPLATE quando chiamate l'CreateDataSourceAPI.

  • Modalità di sincronizzazione: specifica come Amazon Kendra aggiornare l'indice quando il contenuto dell'origine dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione. Puoi scegliere tra:

    • FORCED_FULL_CRAWLper indicizzare nuovamente tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

    • FULL_CRAWLper indicizzare solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

    Importante

    Poiché non esiste un'API per aggiornare i messaggi Gmail eliminati definitivamente, né per la sincronizzazione dei contenuti nuovi, modificati o eliminati:

    • Non rimuoverà dal tuo indice i messaggi eliminati definitivamente da Gmail Amazon Kendra

    • Non sincronizzerà le modifiche nelle etichette delle email di Gmail

    Per sincronizzare le modifiche alle etichette delle sorgenti dati di Gmail e i messaggi email eliminati definitivamente con il tuo Amazon Kendra indice, devi eseguire periodicamente ricerche per indicizzazione complete.

  • Secret Amazon Resource Name (ARN): fornisci l'Amazon Resource Name (ARN) di un Secrets Manager segreto che contiene le credenziali di autenticazione per il tuo account Gmail. Il segreto è archiviato in una struttura JSON con le seguenti chiavi:

    { "adminAccountEmailId": "service account email", "clientEmailId": "user account email", "privateKey": "private key" }
  • IAM ruolo: specifica RoleArn quando chiami CreateDataSource per fornire a un IAM ruolo le autorizzazioni per accedere al tuo Secrets Manager segreto e per chiamare le API pubbliche richieste per il connettore Gmail e. Amazon Kendra Per ulteriori informazioni, consulta i IAM ruoli per le fonti di dati di Gmail.

Puoi anche aggiungere le seguenti funzionalità opzionali:

  • Virtual Private Cloud (VPC): VpcConfiguration specifica quando si chiama. CreateDataSource Per ulteriori informazioni, consulta Configurazione Amazon Kendra usare un Amazon VPC.

  • Filtri di inclusione ed esclusione: specifica se includere o escludere determinate e-mail «a», «from», «cc», «bcc».

    Nota

    La maggior parte delle fonti di dati utilizza modelli di espressioni regolari, che sono modelli di inclusione o esclusione denominati filtri. Se si specifica un filtro di inclusione, viene indicizzato solo il contenuto che corrisponde al filtro di inclusione. Qualsiasi documento che non corrisponde al filtro di inclusione non viene indicizzato. Se si specifica un filtro di inclusione ed esclusione, i documenti che corrispondono al filtro di esclusione non vengono indicizzati, anche se corrispondono al filtro di inclusione.

  • Filtro del contesto utente e controllo degli accessi:Amazon Kendra esegue la ricerca per indicizzazione dell'elenco di controllo degli accessi (ACL) dei documenti, se disponi di un ACL per i documenti. Le informazioni ACL vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.

  • Mappature dei campi: scegli di mappare i campi dell'origine dati di Gmail ai campi dell'indice. Amazon Kendra Per ulteriori informazioni, consulta la sezione Mappatura dei campi di origine dei dati.

    Nota

    Il campo del corpo del documento o l'equivalente del corpo del documento per i documenti è necessario per Amazon Kendra eseguire la ricerca nei documenti. È necessario mappare il nome del campo del corpo del documento nella fonte dati al nome del campo indice_document_body. Tutti gli altri campi sono facoltativi.

    Nota

    Amazon Kendra Il connettore di origine dati di Gmail non supporta la creazione di campi indice personalizzati a causa delle limitazioni dell'API.

Per un elenco di altre importanti chiavi JSON da configurare, consulta lo Gmailschema del modello.

Ulteriori informazioni

Per ulteriori informazioni sull'integrazione Amazon Kendra con la tua fonte di dati Gmail, consulta:

Note

  • Poiché non esiste un'API per aggiornare i messaggi Gmail eliminati definitivamente, una sincronizzazione dei FULL_CRAWL contenuti nuovi, modificati o eliminati:

    • Non rimuoverà dal tuo indice i messaggi che sono stati eliminati definitivamente da Gmail Amazon Kendra

    • Non sincronizzerà le modifiche nelle etichette delle email di Gmail

    Per sincronizzare le modifiche alle etichette delle sorgenti dati di Gmail e i messaggi email eliminati definitivamente con il tuo Amazon Kendra indice, devi eseguire periodicamente ricerche per indicizzazione complete.

  • Amazon Kendra Il connettore di origine dati di Gmail non supporta la creazione di campi indice personalizzati a causa delle limitazioni dell'API.