Connettore Confluence V2.0 - Amazon Kendra

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Connettore Confluence V2.0

Confluence è uno strumento collaborativo di gestione del lavoro progettato per condividere, archiviare e lavorare sulla pianificazione di progetti, lo sviluppo di software e la gestione dei prodotti. Puoi utilizzarlo Amazon Kendra per indicizzare gli spazi, le pagine (incluse le pagine annidate), i blog e i commenti e gli allegati di Confluence a pagine e blog indicizzati.

Per la risoluzione dei problemi relativi al connettore di origine dati Confluence, consulta. Amazon Kendra Risoluzione dei problemi relativi alle origini dati

Funzionalità supportate

Amazon Kendra Il connettore di origine dati Confluence supporta le seguenti funzionalità:

  • Mappature dei campi

  • Controllo degli accessi degli utenti

  • Modelli di inclusione/esclusione

  • Sincronizzazione completa e incrementale dei contenuti

  • Cloud privato virtuale () VPC

Prerequisiti

Prima di poterla utilizzare Amazon Kendra per indicizzare la tua fonte di dati Confluence, apporta queste modifiche a Confluence e agli account. AWS

In Confluence, assicurati di avere:

  • Hai copiato la tua istanza di Confluence. URL Per esempio: https://example.confluence.com, o https://www.example.confluence.com/, oppure https:// atlassian.net/. Hai bisogno della tua istanza Confluence URL a cui connetterti. Amazon Kendra

    Se utilizzi Confluence Cloud, il tuo host deve terminare con URL atlassian.net/.

    Nota

    I seguenti URL formati non sono supportati:

    • https://example.confluence.com/xyz

    • https://www.example.confluence.com//wiki/spacekey/xxx

    • https://atlassian.net/xyz

    Nota

    (On-premise/server) Amazon Kendra verifica se le informazioni sull'endpoint incluse sono le stesse informazioni sull'endpoint specificate nei dettagli di configurazione dell'origine dati. AWS Secrets Manager In questo modo si evita il problema del confuso vicario, ossia un problema di sicurezza in cui un utente non è autorizzato a eseguire un'azione ma lo utilizza Amazon Kendra come proxy per accedere al segreto configurato ed eseguire l'azione. Se successivamente modifichi le informazioni sull'endpoint, devi creare un nuovo segreto per sincronizzare queste informazioni.

  • Credenziali di autenticazione di base configurate contenenti un nome utente (ID e-mail utilizzato per accedere a Confluence) e una password (token Confluence API come password). Vedi Gestire i API token per il tuo account Atlassian.

    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

  • Facoltativo: credenziali OAuth 2.0 configurate contenenti una chiave dell'app Confluence, un segreto dell'app Confluence, un token di accesso Confluence e un token di aggiornamento Confluence per consentire la connessione all'istanza Confluence. Amazon Kendra Se il token di accesso scade, puoi utilizzare il token di aggiornamento per rigenerare il token di accesso e la coppia di token di aggiornamento. In alternativa, puoi ripetere la procedura di autorizzazione. Per ulteriori informazioni sui token di accesso, consulta Gestire i token di OAuth accesso.

  • (Solo per Confluence Server/Data Center) Opzionale: hai configurato un token di accesso personale () in Confluence. PAT Vedi Utilizzo dei token di accesso personali.

Nel tuo Account AWS, assicurati di avere:

  • Ha creato un Amazon Kendra indice e, se si utilizza ilAPI, ha annotato l'ID dell'indice.

  • Hai creato un IAM ruolo per la tua fonte di dati e, se utilizzi ilAPI, hai annotato il IAM ruolo. ARN

    Nota

    Se modifichi il tipo di autenticazione e le credenziali, devi aggiornare il IAM ruolo per accedere all'ID AWS Secrets Manager segreto corretto.

  • Hai archiviato le credenziali di autenticazione Confluence in un luogo AWS Secrets Manager segreto e, se utilizzi ilAPI, hai annotato il ARN segreto.

    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

Se non disponi di un IAM ruolo o di un segreto esistente, puoi utilizzare la console per creare un nuovo IAM ruolo e un Secrets Manager segreto quando connetti l'origine dati Confluence a. Amazon Kendra Se utilizzi ilAPI, devi fornire un IAM ruolo e un Secrets Manager segreto esistenti e un ID di indice. ARN

Istruzioni di connessione

Per connetterti Amazon Kendra alla tua fonte dati Confluence, devi fornire i dettagli necessari della fonte dati Confluence in modo che Amazon Kendra possa accedere ai tuoi dati. Se non hai ancora configurato Confluence for see. Amazon Kendra Prerequisiti

Console

Per connettersi a Confluence Amazon Kendra

  1. Accedi a AWS Management Console e apri la Amazon Kendra console.

  2. Dal riquadro di navigazione a sinistra, scegli Indici, quindi scegli l'indice che desideri utilizzare dall'elenco degli indici.

    Nota

    Puoi scegliere di configurare o modificare le impostazioni del controllo dell'accesso degli utenti in Impostazioni dell'indice.

  3. Nella pagina Guida introduttiva, scegli Aggiungi origine dati.

  4. Nella pagina Aggiungi origine dati, scegli Confluence connector, quindi scegli Aggiungi connettore. Se utilizzi la versione 2 (se applicabile), scegli il connettore Confluence con il tag «V2.0".

  5. Nella pagina Specificare i dettagli dell'origine dati, inserisci le seguenti informazioni:

    1. In Nome e descrizione, per Nome dell'origine dati, inserisci un nome per l'origine dati. Puoi includere trattini ma non spazi.

    2. (Facoltativo) Descrizione: immetti una descrizione facoltativa per l'origine dati.

    3. In Lingua predefinita: scegli una lingua per filtrare i documenti per l'indice. Se non diversamente specificato, la lingua predefinita è l'inglese. La lingua specificata nei metadati del documento ha la precedenza sulla lingua selezionata.

    4. In Tag, per Aggiungi nuovo tag, includi tag opzionali per cercare e filtrare le risorse o tenere traccia dei costi. AWS

    5. Scegli Next (Successivo).

  6. Nella pagina Definisci accesso e sicurezza, inserisci le seguenti informazioni:

    1. In Source, scegli Confluence Cloud o Confluence Server/Data Center.

    2. Confluence: inserisci l'host Confluence. URL URL Ad esempio, https://example.confluence.com.

    3. (Solo per Confluence Server/Data Center) posizione del certificato: opzionale: inserisci il percorso del file di SSL certificato per Confluence Server. Amazon S3 SSL

    4. (Solo per Confluence Server/Data Center) Proxy Web: opzionale: immettere il nome host del proxy Web (senza il https:// protocollo http:// o) e il numero di porta (porta utilizzata dal protocollo di trasporto dell'host). URL Il numero di porta deve essere un valore numerico compreso tra 0 e 65535.

    5. Autorizzazione: attiva o disattiva le informazioni della lista di controllo degli accessi (ACL) per i tuoi documenti, se ne hai una ACL e desideri utilizzarla per il controllo degli accessi. ACLspecifica a quali documenti possono accedere utenti e gruppi. Le ACL informazioni vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.

    6. Autenticazione: scegli l'autenticazione di base, l'autenticazione OAuth 2.0 o (solo per Confluence Server/Data Center) l'autenticazione con token di accesso personale.

    7. AWS Secrets Manager segreto: scegli un segreto esistente o crea un nuovo Secrets Manager segreto per archiviare le credenziali di autenticazione Confluence. Se scegli di creare un nuovo segreto, si apre una finestra segreta. AWS Secrets Manager Inserisci le seguenti informazioni nella finestra:

      1. Nome segreto: un nome per il tuo segreto. Il prefisso 'AmazonKendra-Confluence-' viene aggiunto automaticamente al nome segreto.

      2. Se utilizzi l'autenticazione di base, inserisci il nome segreto, il nome utente e la password (APItoken Confluence come password) che hai configurato in Confluence.

        Se utilizzi l'autenticazione OAuth2 2.0, inserisci il nome segreto, la chiave dell'app, il segreto dell'app, il token di accesso e il token di aggiornamento che hai configurato in Confluence.

        (Solo Confluence Server/Data Center) Se utilizzi l'autenticazione con token di accesso personale, inserisci il nome segreto e il token Confluence che hai configurato in Confluence.

      3. Salva e aggiungi il tuo segreto.

    8. Virtual Private Cloud (VPC): puoi scegliere di utilizzare unVPC. In tal caso, è necessario aggiungere sottoreti e VPC gruppi di sicurezza.

    9. Identity crawler: specifica se attivare il crawler di identità. Amazon Kendra Il crawler di identità utilizza le informazioni dell'elenco di controllo degli accessi (ACL) per i documenti per filtrare i risultati della ricerca in base all'accesso dell'utente o del gruppo di appartenenza ai documenti. Se ne hai uno ACL per i tuoi documenti e scegli di utilizzare il tuoACL, puoi anche scegliere di attivare il crawler Amazon Kendra di identità per configurare il filtraggio contestuale dell'utente dei risultati di ricerca. Altrimenti, se il crawler di identità è disattivato, tutti i documenti possono essere ricercati pubblicamente. Se desideri utilizzare il controllo di accesso per i tuoi documenti e il crawler di identità è disattivato, in alternativa puoi utilizzarlo PutPrincipalMappingAPIper caricare le informazioni di accesso di utenti e gruppi per il filtraggio del contesto degli utenti.

    10. IAM ruolo: scegli un IAM ruolo esistente o creane uno nuovo IAM per accedere alle credenziali del repository e indicizzare il contenuto.

      Nota

      IAM i ruoli utilizzati per gli indici non possono essere utilizzati per le fonti di dati. Se non sei sicuro che un ruolo esistente venga utilizzato per un indice oppure FAQ scegli Crea un nuovo ruolo per evitare errori.

    11. Scegli Next (Successivo).

  7. Nella pagina Configura le impostazioni di sincronizzazione, inserisci le seguenti informazioni:

    1. Nell'ambito di sincronizzazione, per Sincronizza contenuti: scegli di sincronizzare tra i seguenti tipi di contenuto: pagine, commenti alle pagine, allegati di pagina, blog, commenti del blog, allegati di blog, spazi personali e spazi archiviati.

      Nota

      I commenti e gli allegati delle pagine possono essere selezionati solo se scegli di sincronizzare Pages. I commenti e gli allegati del blog possono essere selezionati solo se scegli di sincronizzare i blog.

      Importante

      Se non specifichi un pattern regex con chiave spaziale in Configurazione aggiuntiva, per impostazione predefinita, tutte le pagine e i blog verranno sottoposti a scansione.

    2. In Configurazione aggiuntiva, per Dimensione massima del file: specifica il limite di dimensione del file da sottoporre a scansione. MBs Amazon Kendra Amazon Kendra eseguirà la scansione solo dei file entro il limite di dimensione definito. La dimensione predefinita del file è 50 MB. La dimensione massima del file deve essere superiore a 0 MB e inferiore o uguale a 50 MB.

      Per i modelli regex di Spaces: specifica se includere o escludere spazi specifici nell'indice utilizzando:

      • Chiave spaziatrice (ad esempio, my-space-123)

        Nota

        Se non specifichi un pattern regex con chiave spaziale, per impostazione predefinita, tutte le pagine e i blog verranno sottoposti a scansione.

      • URL(ad esempio, .*/MySite/MyDocuments/)

      • Tipo di file (ad esempio, .*\.pdf, .*\.txt)

      Per i modelli di espressione regolare dei titoli delle entità: specifica i modelli di espressioni regolari per includere o escludere determinati blog, pagine, commenti e allegati in base ai titoli.

      Nota

      Se desideri includere o escludere la scansione di una pagina o sottopagina specifica, puoi utilizzare i modelli di espressione regolare del titolo della pagina.

    3. Modalità di sincronizzazione: scegli come aggiornare l'indice quando il contenuto dell'origine dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione.

      • Sincronizzazione completa: indicizza di nuovo tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

      • Sincronizzazione nuova, modificata ed eliminata: indicizza solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

    4. Nella pianificazione di esecuzione della sincronizzazione, per Frequenza: scegli la frequenza con cui sincronizzare il contenuto della fonte di dati e aggiornare l'indice.

    5. Scegli Next (Successivo).

  8. Nella pagina Imposta mappature dei campi, inserisci le seguenti informazioni:

    1. Seleziona uno dei campi di origine dati predefiniti Amazon Kendra generati che desideri mappare al tuo indice. Per aggiungere campi di origine dati personalizzati, crea un nome di campo indice a cui mappare e il tipo di dati del campo.

    2. Scegli Next (Successivo).

  9. Nella pagina Rivedi e crea, verifica che le informazioni che hai inserito siano corrette, quindi seleziona Aggiungi origine dati. Puoi anche scegliere di modificare le tue informazioni da questa pagina. L'origine dati verrà visualizzata nella pagina Origini dati dopo che l'origine dati sarà stata aggiunta correttamente.

API

Per connettersi Amazon Kendra a Confluence

È necessario specificare uno schema JSON dell'origine dati utilizzando il. TemplateConfigurationAPI È necessario fornire le seguenti informazioni:

  • Origine dati: specificare il tipo di origine dati come CONFLUENCEV2 quando si utilizza TemplateConfigurationJSONschema. Specificate anche l'origine dati come TEMPLATE quando chiamate il CreateDataSource API.

  • Host URL: specifica l'istanza host di Confluence. URL Ad esempio, https://example.confluence.com.

  • Modalità di sincronizzazione: specifica come Amazon Kendra aggiornare l'indice quando il contenuto dell'origine dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione. Puoi scegliere tra:

    • FORCED_FULL_CRAWLper indicizzare nuovamente tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

    • FULL_CRAWLper indicizzare solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

  • Tipo di autenticazione: specifica il tipo di autenticazione, se BasicOAuth2, (solo Confluence Server). Personal-token

  • (Facoltativo, solo per Confluence Server) posizione del certificato: specifica l'e che hai utilizzato per archiviare il SSL certificato. S3bucketName s3certificateName SSL

  • Amazon Resource Name segreto (ARN): fornisci l'Amazon Resource Name (ARN) di un Secrets Manager segreto che contiene le credenziali di autenticazione che hai configurato in Confluence. Se utilizzi l'autenticazione di base, il segreto viene archiviato in una JSON struttura con le seguenti chiavi:

    { "username": "email ID or user name", "password": "Confluence API token" }

    Se si utilizza l'autenticazione OAuth 2.0, il segreto viene archiviato in una JSON struttura con le seguenti chiavi:

    { "confluenceAppKey": "app key", "confluenceAppSecret": "app secret", "confluenceAccessToken": "access token", "confluenceRefreshToken": "refresh token" }

    (Solo per Confluence Server) Se utilizzi l'autenticazione di base, il segreto viene archiviato in una JSON struttura con le seguenti chiavi:

    { "hostUrl": "Confluence Server host URL", "username": "Confluence Server user name", "password": "Confluence Server password" }

    (Solo per Confluence Server) Se utilizzi l'autenticazione con token di accesso personale, il segreto viene archiviato in una JSON struttura con le seguenti chiavi:

    { "hostUrl": "Confluence Server host URL", "patToken": "personal access token" }
  • IAM ruolo: specifica RoleArn quando chiami CreateDataSource per fornire a un IAM ruolo le autorizzazioni per accedere al tuo Secrets Manager segreto e chiamare il pubblico richiesto APIs per il connettore Confluence e. Amazon Kendra Per ulteriori informazioni, consulta i IAM ruoli per le fonti di dati Confluence.

Puoi anche aggiungere le seguenti funzionalità opzionali:

  • Virtual Private Cloud (VPC): specifica VpcConfiguration quando si chiamaCreateDataSource. Per ulteriori informazioni, consulta Configurazione Amazon Kendra per l'utilizzo di un Amazon VPC.

  • Dimensione del file: specifica la dimensione massima del file da sottoporre a scansione.

  • Tipi di documento/contenuto: specificate se eseguire la scansione di pagine, commenti di pagina, allegati di pagina, blog, commenti, allegati del blog, spazi e spazi archiviati.

  • Filtri di inclusione ed esclusione: specifica se includere o escludere determinati spazi, pagine, blog e relativi commenti e allegati.

    Nota

    La maggior parte delle fonti di dati utilizza modelli di espressioni regolari, che sono modelli di inclusione o esclusione denominati filtri. Se si specifica un filtro di inclusione, viene indicizzato solo il contenuto che corrisponde al filtro di inclusione. Qualsiasi documento che non corrisponde al filtro di inclusione non viene indicizzato. Se si specifica un filtro di inclusione ed esclusione, i documenti che corrispondono al filtro di esclusione non vengono indicizzati, anche se corrispondono al filtro di inclusione.

  • Proxy Web: specifica le informazioni sul proxy Web se desideri connetterti all'istanza URL Confluence tramite un proxy Web. Puoi utilizzare questa opzione per Confluence Server.

  • Elenco di controllo degli accessi (ACL): specifica se eseguire la scansione ACL delle informazioni dei documenti, se ne hai uno ACL e desideri utilizzarlo per il controllo degli accessi. ACLspecifica a quali documenti possono accedere utenti e gruppi. Le ACL informazioni vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.

  • Identity crawler: specifica se attivare il crawler di identità. Amazon Kendra Il crawler di identità utilizza le informazioni dell'elenco di controllo degli accessi (ACL) per i documenti per filtrare i risultati della ricerca in base all'accesso dell'utente o del gruppo di appartenenza ai documenti. Se ne hai uno ACL per i tuoi documenti e scegli di utilizzare il tuoACL, puoi anche scegliere di attivare il crawler Amazon Kendra di identità per configurare il filtraggio contestuale dell'utente dei risultati di ricerca. Altrimenti, se il crawler di identità è disattivato, tutti i documenti possono essere ricercati pubblicamente. Se desideri utilizzare il controllo di accesso per i tuoi documenti e il crawler di identità è disattivato, in alternativa puoi utilizzarlo PutPrincipalMappingAPIper caricare le informazioni di accesso di utenti e gruppi per il filtraggio del contesto degli utenti.

  • Mappature dei campi: scegli di mappare i campi delle sorgenti dati di Confluence ai campi indice. Amazon Kendra Per ulteriori informazioni, consulta la sezione Mappatura dei campi di origine dei dati.

    Nota

    Il campo del corpo del documento o l'equivalente del corpo del documento per i documenti è necessario per eseguire la ricerca nei documenti. Amazon Kendra È necessario mappare il nome del campo del corpo del documento nella fonte dati al nome del campo indice_document_body. Tutti gli altri campi sono facoltativi.

Per un elenco di altre JSON chiavi importanti da configurare, consulta lo schema del modello di Confluence.

Note

  • Il token di accesso personale (PAT) non è disponibile per Confluence Cloud.