Aurora (PostgreSQL) - Amazon Kendra

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Aurora (PostgreSQL)

Aurora è un sistema di gestione di database relazionali (RDBMS) creato per il cloud. Se sei un Aurora utente, puoi utilizzarlo Amazon Kendra per indicizzare la tua Aurora (PostgreSQL) fonte di dati. Il connettore di origine Amazon Kendra Aurora (PostgreSQL) dati supporta Aurora PostgreSQL 1.

Puoi connetterti Amazon Kendra alla tua fonte di Aurora (PostgreSQL) dati utilizzando la Amazon Kendra console e l'API. TemplateConfiguration

Per la risoluzione dei problemi relativi al connettore della sorgente Amazon Kendra Aurora (PostgreSQL) dati, consultaRisoluzione dei problemi relativi alle origini dati.

Funzionalità supportate

  • Mappature dei campi

  • Filtraggio del contesto utente

  • Filtri di inclusione/esclusione

  • Sincronizzazione completa e incrementale dei contenuti

  • Virtual Private Cloud (VPC) (Cloud privato virtuale (VPC)

Prerequisiti

Prima di poterla utilizzare Amazon Kendra per indicizzare la tua fonte di Aurora (PostgreSQL) dati, apporta queste modifiche al tuo account Aurora (PostgreSQL) e AWS ai tuoi account.

NelAurora (PostgreSQL), assicurati di avere:

  • Hai annotato il nome utente e la password del database.

    Importante

    È consigliabile fornire credenziali Amazon Kendra di database di sola lettura.

  • Hai copiato l'URL, la porta e l'istanza dell'host del database.

  • È stato verificato che ogni documento sia unico all'interno Aurora (PostgreSQL) e tra le altre fonti di dati che intendi utilizzare per lo stesso indice. Ogni fonte di dati che desideri utilizzare per un indice non deve contenere lo stesso documento in tutte le fonti di dati. Gli ID dei documenti sono globali rispetto a un indice e devono essere univoci per indice.

Nel tuo Account AWS, assicurati di avere:

  • Ha creato un Amazon Kendra indice e, se si utilizza l'API, ha annotato l'ID dell'indice.

  • Hai creato un IAM ruolo per la tua origine dati e, se utilizzi l'API, hai annotato l'ARN del IAM ruolo.

    Nota

    Se modifichi il tipo di autenticazione e le credenziali, devi aggiornare il IAM ruolo per accedere all'ID AWS Secrets Manager segreto corretto.

  • Ha archiviato le credenziali di Aurora (PostgreSQL) autenticazione in un AWS Secrets Manager segreto e, se si utilizza l'API, ha annotato l'ARN del segreto.

    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e nelle versioni 1.0 e 2.0 dei connettori (ove applicabile).

Se non disponi di un IAM ruolo o di un segreto esistente, puoi utilizzare la console per creare un nuovo IAM ruolo e un Secrets Manager segreto quando connetti la tua origine Aurora (PostgreSQL) dati a. Amazon Kendra Se utilizzi l'API, devi fornire l'ARN di un IAM ruolo e di un Secrets Manager segreto esistenti e un ID di indice.

Istruzioni di connessione

Per connetterti Amazon Kendra alla tua fonte di Aurora (PostgreSQL) dati devi fornire i dettagli delle tue Aurora (PostgreSQL) credenziali in modo da Amazon Kendra poter accedere ai tuoi dati. Se non lo hai ancora configurato, Aurora (PostgreSQL) Amazon Kendra Prerequisiti consulta.

Console

Per connettersi Amazon Kendra a Aurora (PostgreSQL)

  1. Accedi a AWS Management Console e apri la Amazon Kendra console.

  2. Dal riquadro di navigazione a sinistra, scegli Indici, quindi scegli l'indice che desideri utilizzare dall'elenco degli indici.

    Nota

    Puoi scegliere di configurare o modificare le impostazioni del controllo dell'accesso degli utenti in Impostazioni dell'indice.

  3. Nella pagina Guida introduttiva, scegli Aggiungi origine dati.

  4. Nella pagina Aggiungi origine dati, scegli Aurora (PostgreSQL)connettore, quindi scegli Aggiungi connettore. Se utilizzi la versione 2 (se applicabile), scegli il Aurora (PostgreSQL)connettore con il tag «V2.0".

  5. Nella pagina Specificare i dettagli dell'origine dati, inserisci le seguenti informazioni:

    1. In Nome e descrizione, per Nome dell'origine dati, inserisci un nome per l'origine dati. Puoi includere trattini ma non spazi.

    2. (Facoltativo) Descrizione: immetti una descrizione facoltativa per l'origine dati.

    3. In Lingua predefinita: scegli una lingua per filtrare i documenti per l'indice. Se non diversamente specificato, la lingua predefinita è l'inglese. La lingua specificata nei metadati del documento ha la precedenza sulla lingua selezionata.

    4. In Tag, per Aggiungi nuovo tag, includi tag opzionali per cercare e filtrare le risorse o tenere traccia dei costi. AWS

    5. Seleziona Successivo.

  6. Nella pagina Definisci accesso e sicurezza, inserisci le seguenti informazioni:

    1. In Source, inserisci le seguenti informazioni:

    2. Host: inserisci l'URL dell'host del database, per esempio:http://instance URL.region.rds.amazonaws.com.

    3. Porta: inserisci la porta del database, ad esempio,5432.

    4. Istanza: immettere, ad esempio, l'istanza del databasepostgres.

    5. Abilita la posizione del certificato SSL: scegli di inserire il Amazon S3 percorso del file del certificato SSL.

    6. In Autenticazione, inserisci le seguenti informazioni:

      1. AWS Secrets Manager segreto: scegli un segreto esistente o creane uno nuovo Secrets Manager per memorizzare le credenziali di Aurora (PostgreSQL) autenticazione. Se scegli di creare un nuovo segreto, si apre una finestra AWS Secrets Manager segreta.

        1. Inserisci le seguenti informazioni nella finestra Crea un AWS Secrets Manager segreto:

          1. Nome segreto: un nome per il tuo segreto. Il prefisso 'AmazonKendra- Aurora (PostgreSQL) -' viene aggiunto automaticamente al nome segreto.

          2. Per nome utente e password del database, immettete i valori delle credenziali di autenticazione copiati dal database.

        2. Selezionare Salva.

    7. Virtual Private Cloud (VPC): puoi scegliere di utilizzare un VPC. In tal caso, è necessario aggiungere sottoreti e gruppi di sicurezza VPC.

    8. IAM ruolo: scegli un IAM ruolo esistente o creane uno nuovo IAM per accedere alle credenziali del repository e indicizzare il contenuto.

      Nota

      IAM i ruoli utilizzati per gli indici non possono essere utilizzati per le fonti di dati. Se non sei sicuro che un ruolo esistente venga utilizzato per un indice o una FAQ, scegli Crea un nuovo ruolo per evitare errori.

    9. Seleziona Successivo.

  7. Nella pagina Configura le impostazioni di sincronizzazione, inserisci le seguenti informazioni:

    1. Nell'ambito della sincronizzazione, scegli tra le seguenti opzioni:

      • Query SQL: immetti istruzioni di query SQL come le operazioni SELECT e JOIN. Le query SQL devono pesare meno di 32 KB Le query SQL devono pesare meno di 32 KB e non contenere punto e virgola (;). Amazon Kendra eseguirà la scansione di tutto il contenuto del database che corrisponde alla tua query.

      • Colonna chiave primaria: fornisce la chiave primaria per la tabella del database. Identifica una tabella all'interno del database.

      • Colonna del titolo: fornisce il nome della colonna del titolo del documento all'interno della tabella del database.

      • Colonna del corpo: fornisce il nome della colonna del corpo del documento all'interno della tabella del database.

    2. In Configurazione aggiuntiva, facoltativa, scegli una delle seguenti opzioni per sincronizzare contenuti specifici anziché sincronizzare tutti i file:

      • Colonne di rilevamento delle modifiche: inserisci i nomi delle colonne che Amazon Kendra verranno utilizzate per rilevare le modifiche al contenuto. Amazon Kendra reindicizzerà il contenuto quando viene apportata una modifica in una di queste colonne.

      • Colonna ID utenti: immetti il nome della colonna che contiene gli ID utente a cui consentire l'accesso ai contenuti.

      • Colonna Gruppi: immetti il nome della colonna che contiene i gruppi a cui consentire l'accesso ai contenuti.

      • Colonna URL di origine: inserisci il nome della colonna che contiene gli URL di origine da indicizzare.

      • Colonna timestamp: immetti il nome della colonna che contiene i timestamp. Amazon Kendra utilizza le informazioni relative alla marca temporale per rilevare le modifiche ai contenuti e sincronizzare solo i contenuti modificati.

      • Colonna dei fusi orari: inserisci il nome della colonna che contiene i fusi orari per il contenuto da sottoporre a scansione.

      • Formato timestamp: immetti il nome della colonna che contiene i formati di timestamp da utilizzare per rilevare le modifiche ai contenuti e risincronizzare i contenuti.

    3. Modalità di sincronizzazione: scegli come aggiornare l'indice quando il contenuto della fonte dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione.

      • Sincronizzazione completa: indicizza di nuovo tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

      • Sincronizzazione nuova e modificata: indicizza solo i contenuti nuovi e modificati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

      • Sincronizzazione nuova, modificata ed eliminata: indicizza solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

    4. Pianificazione di esecuzione di In Sync, per Frequenza: con quale frequenza Amazon Kendra verrà eseguita la sincronizzazione con la fonte di dati.

    5. Seleziona Successivo.

  8. Nella pagina Imposta le mappature dei campi, inserisci le seguenti informazioni:

    1. Seleziona uno dei campi di origine dati predefiniti generati (ID documento, titoli dei documenti e URL di origine) che desideri mappare per indicizzare. Amazon Kendra

    2. Aggiungi campo: consente di aggiungere campi di origine dati personalizzati per creare un nome di campo indice a cui mappare e il tipo di dati del campo.

    3. Seleziona Successivo.

  9. Nella pagina Rivedi e crea, verifica che le informazioni inserite siano corrette, quindi seleziona Aggiungi origine dati. Puoi anche scegliere di modificare le tue informazioni da questa pagina. L'origine dati verrà visualizzata nella pagina Origini dati dopo che l'origine dati sarà stata aggiunta correttamente.

API

Per connettersi Amazon Kendra a Aurora (PostgreSQL)

È necessario specificare quanto segue utilizzando l'TemplateConfigurationAPI:

  • Origine dati: specifica il tipo di origine dati come JDBC quando usi lo schema TemplateConfigurationJSON. Specificate anche l'origine dati come TEMPLATE quando chiamate l'CreateDataSourceAPI.

  • Tipo di database: è necessario specificare il tipo di database comepostgresql.

  • Query SQL: specifica le istruzioni di query SQL come le operazioni SELECT e JOIN. Le query SQL devono pesare meno di 32 KB. Amazon Kendra eseguirà la scansione di tutto il contenuto del database che corrisponde alla tua query.

  • Modalità di sincronizzazione: specifica come Amazon Kendra aggiornare l'indice quando il contenuto dell'origine dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione. Puoi scegliere tra:

    • FORCED_FULL_CRAWLper indicizzare nuovamente tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

    • FULL_CRAWLper indicizzare solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

    • CHANGE_LOGper indicizzare solo contenuti nuovi e modificati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

  • Amazon Resource Name (ARN) segreto: fornisci l'Amazon Resource Name (ARN) di un Secrets Manager segreto che contiene le credenziali di autenticazione che hai creato nel tuo account. Aurora (PostgreSQL) Il segreto è archiviato in una struttura JSON con le seguenti chiavi:

    { "user name": "database user name", "password": "password" }
    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e nelle versioni 1.0 e 2.0 dei connettori (ove applicabile).

  • IAM ruolo: specifica RoleArn quando chiami CreateDataSource per fornire a un IAM ruolo le autorizzazioni per accedere al tuo Secrets Manager segreto e per chiamare le API pubbliche richieste per il connettore e. Aurora (PostgreSQL) Amazon Kendra Per ulteriori informazioni, consulta i IAM ruoli per Aurora (PostgreSQL) le fonti di dati.

Puoi anche aggiungere le seguenti funzionalità opzionali:

  • Virtual Private Cloud (VPC): VpcConfiguration specifica quando si chiama. CreateDataSource Per ulteriori informazioni, consulta Configurazione Amazon Kendra per l'utilizzo di un Amazon VPC.

  • Filtri di inclusione ed esclusione: puoi specificare se includere contenuti specifici utilizzando ID utente, gruppi, URL di origine, timestamp e fusi orari.

  • Filtraggio del contesto utente e controllo degli accessi:Amazon Kendra esegue la ricerca per indicizzazione dell'elenco di controllo degli accessi (ACL) dei documenti, se disponi di un ACL per i documenti. Le informazioni ACL vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.

  • Mappature dei campi: scegli di mappare i campi delle sorgenti Aurora (PostgreSQL) dati ai campi indice. Amazon Kendra Per ulteriori informazioni, consulta la sezione Mappatura dei campi di origine dei dati.

    Nota

    Il campo del corpo del documento o l'equivalente del corpo del documento per i documenti è necessario per Amazon Kendra eseguire la ricerca nei documenti. È necessario mappare il nome del campo del corpo del documento nella fonte dati al nome del campo indice_document_body. Tutti gli altri campi sono facoltativi.

Per un elenco di altre importanti chiavi JSON da configurare, consultaAurora Schema del modello (PostgreSQL).

Note

  • Le righe del database eliminate non verranno registrate durante la Amazon Kendra verifica della presenza di contenuti aggiornati.

  • La dimensione dei nomi e dei valori dei campi in una riga del database non può superare i 400 KB.

  • Se l'origine dati del database contiene una grande quantità di dati e non desideri Amazon Kendra indicizzare tutto il contenuto del database dopo la prima sincronizzazione, puoi scegliere di sincronizzare solo i documenti nuovi, modificati o eliminati.

  • È consigliabile fornire credenziali Amazon Kendra di database di sola lettura.

  • È consigliabile evitare di aggiungere tabelle con dati sensibili o informazioni personali identificabili (PII).