Alfresco - Amazon Kendra

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Alfresco

Alfrescoè un servizio di gestione dei contenuti che aiuta i clienti a archiviare e gestire i propri contenuti. Puoi usarlo Amazon Kendra per indicizzare la tua libreria di Alfresco documenti, il wiki e il blog.

Amazon Kendra supporta Alfresco On-Premises e Alfresco Cloud (Platform as a Service).

Puoi connetterti Amazon Kendra alla tua fonte di Alfresco dati utilizzando la Amazon Kendra console o l'TemplateConfigurationAPI.

Per la risoluzione dei problemi relativi al connettore di origine dati Amazon Kendra Alfresco, consultaRisoluzione dei problemi relativi alle origini dati.

Funzionalità supportate

Amazon Kendra Alfrescoil connettore di origine dati supporta le seguenti funzionalità:

  • mappature dei campi

  • Filtri di inclusione/esclusione

  • Sincronizzazione completa e incrementale dei contenuti

  • Virtual Private Cloud (VPC) (Cloud privato virtuale (VPC)

  • Filtraggio del contesto utente

  • OAuth 2.0 e autenticazione di base

Prerequisiti

Prima di poterla utilizzare Amazon Kendra per indicizzare la fonte di dati Alfresco, apporta queste modifiche nel tuo and. Alfresco Account AWS

NelAlfresco, assicurati di avere:

  • Hai copiato l'URL del Alfresco repository e l'URL dell'applicazione web. Se desideri indicizzare solo un Alfresco sito specifico, copia anche l'ID del sito.

  • Hai annotato le tue credenziali di Alfresco autenticazione, che includono un nome utente e una password con almeno autorizzazioni di lettura. Se desideri utilizzare l'autenticazione OAuth 2.0, devi aggiungere l'utente al gruppo degli amministratori. Alfresco

  • Facoltativo: credenziali OAuth 2.0 generate in. Alfresco Le credenziali includono l'ID client, il segreto del client e l'URL del token. Per ulteriori informazioni su come configurare i client per Alfresco On-Premises, consulta la documentazione di Alfresco. Se utilizzi Alfresco Cloud (PaaS), devi contattare l'assistenza Hyland per Alfresco l'autenticazione OAuth 2.0.

  • È stato verificato che ogni documento sia unico in Alfresco e tra le altre fonti di dati che intendi utilizzare per lo stesso indice. Ogni fonte di dati che si desidera utilizzare per un indice non deve contenere lo stesso documento in tutte le fonti di dati. Gli ID dei documenti sono globali rispetto a un indice e devono essere univoci per indice.

Nel tuo Account AWS, assicurati di avere:

  • Ha creato un Amazon Kendra indice e, se si utilizza l'API, ha annotato l'ID dell'indice.

  • Hai creato un IAM ruolo per la tua origine dati e, se utilizzi l'API, hai annotato l'ARN del IAM ruolo.

    Nota

    Se modifichi il tipo di autenticazione e le credenziali, devi aggiornare il IAM ruolo per accedere all'ID AWS Secrets Manager segreto corretto.

  • Ha archiviato le credenziali di autenticazione Alfresco in un AWS Secrets Manager segreto e, se si utilizza l'API, ha annotato l'ARN del segreto.

    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

Se non disponi di un IAM ruolo o di un segreto esistente, puoi utilizzare la console per creare un nuovo IAM ruolo e un Secrets Manager segreto quando connetti la tua fonte di dati Alfresco a. Amazon Kendra Se utilizzi l'API, devi fornire l'ARN di un IAM ruolo e di un Secrets Manager segreto esistenti e un ID di indice.

Istruzioni di connessione

Per connetterti Amazon Kendra alla tua fonte di dati Alfresco, devi fornire i dettagli necessari della tua origine dati Alfresco in modo che Amazon Kendra possa accedere ai tuoi dati. Se non hai ancora configurato Alfresco per Amazon Kendra, consulta. Prerequisiti

Console

Per connettersi Amazon Kendra a Alfresco

  1. Accedi a AWS Management Console e apri la Amazon Kendra console.

  2. Dal riquadro di navigazione a sinistra, scegli Indici, quindi scegli l'indice che desideri utilizzare dall'elenco degli indici.

    Nota

    Puoi scegliere di configurare o modificare le impostazioni del controllo dell'accesso degli utenti in Impostazioni dell'indice.

  3. Nella pagina Guida introduttiva, scegli Aggiungi origine dati.

  4. Nella pagina Aggiungi origine dati, scegli Alfresco connector, quindi scegli Aggiungi connettore.

  5. Nella pagina Specificare i dettagli dell'origine dati, inserisci le seguenti informazioni:

    1. In Nome e descrizione, per Nome dell'origine dati, inserisci un nome per l'origine dati. Puoi includere trattini ma non spazi.

    2. (Facoltativo) Descrizione: immetti una descrizione facoltativa per l'origine dati.

    3. In Lingua predefinita: scegli una lingua per filtrare i documenti per l'indice. Se non diversamente specificato, la lingua predefinita è l'inglese. La lingua specificata nei metadati del documento ha la precedenza sulla lingua selezionata.

    4. In Tag, per Aggiungi nuovo tag, includi tag opzionali per cercare e filtrare le risorse o tenere traccia dei costi. AWS

    5. Seleziona Successivo.

  6. Nella pagina Definisci accesso e sicurezza, inserisci le seguenti informazioni:

    1. Alfrescotipo: scegli se utilizzare Alfresco On-Premises o Alfresco Cloud (Platform as a Service).

    2. URL del repository Alfresco: immettete l'URL del repository Alfresco. Ad esempio, se si utilizza Alfresco Cloud (PaaS), l'URL del repository potrebbe essere. https://company.alfrescocloud.com Oppure, se utilizzi Alfresco On-Premises, l'URL del repository potrebbe essere. https://company-alfresco-instance.company-domain.suffix:port

    3. Applicazione utente Alfresco. URL: inserisci l'URL Alfresco dell'interfaccia utente. Puoi ottenere l'URL del repository dal tuo Alfresco amministratore. Ad esempio, l'URL dell'interfaccia utente potrebbe essere https://example.com.

    4. Posizione del certificato SSL: immetti il percorso del certificato SSL archiviato in un bucket. Amazon S3 La usi per connetterti a Alfresco On-Premises con una connessione SSL sicura.

    5. Autorizzazione: attiva o disattiva le informazioni dell'elenco di controllo degli accessi (ACL) per i tuoi documenti, se disponi di un ACL e desideri utilizzarlo per il controllo degli accessi. L'ACL specifica a quali documenti possono accedere utenti e gruppi. Le informazioni ACL vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.

    6. Autenticazione: scegli l'autenticazione di base o l'autenticazione OAuth 2.0. Quindi scegli un Secrets Manager segreto esistente o crea un nuovo segreto per archiviare le tue credenziali. Alfresco Se scegli di creare un nuovo segreto, si apre una finestra AWS Secrets Manager segreta.

      Se hai scelto Autenticazione di base, inserisci un nome per il segreto, il nome Alfresco utente e la password.

      Se hai scelto l'autenticazione OAuth 2.0, inserisci un nome per il segreto, l'ID client, il segreto del client e l'URL del token.

    7. Virtual Private Cloud (VPC): puoi scegliere di utilizzare un VPC. In tal caso, è necessario aggiungere sottoreti e gruppi di sicurezza VPC.

    8. Identity crawler: specifica se attivare il crawler di identità. Amazon Kendra Il crawler di identità utilizza le informazioni dell'elenco di controllo degli accessi (ACL) per i documenti per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Se disponi di un ACL per i tuoi documenti e scegli di utilizzarlo, puoi anche scegliere di attivare il crawler di identità per configurare il filtraggio Amazon Kendra del contesto utente dei risultati di ricerca. Altrimenti, se il crawler di identità è disattivato, tutti i documenti possono essere ricercati pubblicamente. Se desideri utilizzare il controllo degli accessi per i tuoi documenti e il crawler di identità è disattivato, in alternativa puoi utilizzare l'PutPrincipalMappingAPI per caricare le informazioni di accesso di utenti e gruppi per il filtraggio del contesto degli utenti.

    9. IAM ruolo: scegli un IAM ruolo esistente o creane uno nuovo IAM per accedere alle credenziali del repository e indicizzare il contenuto.

      Nota

      IAM i ruoli utilizzati per gli indici non possono essere utilizzati per le fonti di dati. Se non sei sicuro che un ruolo esistente venga utilizzato per un indice o una FAQ, scegli Crea un nuovo ruolo per evitare errori.

    10. Seleziona Successivo.

  7. Nella pagina Configura le impostazioni di sincronizzazione, inserisci le seguenti informazioni:

    1. Ambito di sincronizzazione: imposta i limiti per la scansione di determinati contenuti e filtra i contenuti utilizzando modelli di espressioni regex.

      1. Contenuto: scegli se eseguire la scansione dei contenuti contrassegnati con «Aspetti» inAlfresco, dei contenuti all'interno di un Alfresco sito specifico o dei contenuti in tutti i siti. Alfresco

      2. (Facoltativo) Configurazione aggiuntiva: imposta le seguenti impostazioni:

        • Includi commenti: scegli di includere commenti nella libreria di Alfresco documenti e nel blog.

        • Modelli Regex: modelli di espressioni regolari per includere o escludere determinati file.

    2. Modalità di sincronizzazione: scegli come aggiornare l'indice quando il contenuto dell'origine dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione.

      • Sincronizzazione completa: indicizza di nuovo tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

      • Sincronizzazione nuova, modificata ed eliminata: indicizza solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

    3. Nella pianificazione di esecuzione della sincronizzazione, per Frequenza: scegli la frequenza di sincronizzazione con la tua fonte di dati. Amazon Kendra

    4. Seleziona Successivo.

  8. Nella pagina Imposta le mappature dei campi, inserisci le seguenti informazioni:

    1. Seleziona tra i campi di origine dati predefiniti Amazon Kendra generati che desideri mappare al tuo indice.

    2. Per aggiungere campi di origine dati personalizzati, crea un nome di campo indice a cui mappare e il tipo di dati del campo.

    3. Seleziona Successivo.

  9. Nella pagina Rivedi e crea, verifica che le informazioni che hai inserito siano corrette, quindi seleziona Aggiungi origine dati. Puoi anche scegliere di modificare le tue informazioni da questa pagina. L'origine dati verrà visualizzata nella pagina Origini dati dopo che l'origine dati sarà stata aggiunta correttamente.

API

Per connettersi Amazon Kendra a Alfresco

È necessario specificare un codice JSON dello schema dell'origine dati utilizzando l'TemplateConfigurationAPI. È necessario fornire le seguenti informazioni:

  • Origine dati: specifica il tipo di origine dati come ALFRESCO quando usi lo schema TemplateConfigurationJSON. Specificate anche l'origine dati come TEMPLATE quando chiamate l'CreateDataSourceAPI.

  • AlfrescoID del sito: specifica l'ID del sito Alfresco.

  • AlfrescoURL del repository: specifica l'URL del repository. Alfresco È possibile ottenere l'URL del repository dal proprio amministratore. Alfresco Ad esempio, se utilizzi Alfresco Cloud (PaaS), l'URL del repository potrebbe essere. https://company.alfrescocloud.com Oppure, se utilizzi Alfresco On-Premises, l'URL del repository potrebbe essere. https://company-alfresco-instance.company-domain.suffix:port

  • AlfrescoURL dell'applicazione web: specifica l'URL dell'Alfrescointerfaccia utente. È possibile ottenere l'URL del repository dal proprio Alfresco amministratore. Ad esempio, l'URL dell'interfaccia utente potrebbe essere https://example.com.

  • Tipo di autenticazione: specifica il tipo di autenticazione che desideri utilizzare, se OAuth2 oBasic.

  • Alfrescotipo: specifica il tipo di Alfresco servizio utilizzato, se PAAS (Cloud/Platform as a Service) o ON_PREM (On-Premises).

  • Amazon Resource Name (ARN) segreto: se desideri utilizzare l'autenticazione di base, fornisci un codice segreto che memorizza le credenziali di autenticazione del nome utente e della password. Fornisci l'Amazon Resource Name (ARN) di un AWS Secrets Manager segreto. Il segreto viene archiviato in una struttura JSON con le seguenti chiavi:

    { "username": "user name", "password": "password" }

    Se desideri utilizzare l'autenticazione OAuth 2.0, il segreto viene archiviato in una struttura JSON con le seguenti chiavi:

    { "clientId": "client ID", "clientSecret": "client secret", "tokenUrl": "token URL" }
  • IAM role —Specificate RoleArn quando chiamate CreateDataSource per fornire a un IAM ruolo le autorizzazioni per accedere al vostro Secrets Manager segreto e per chiamare le API pubbliche richieste per il connettore Alfresco e. Amazon Kendra Per ulteriori informazioni, consulta i IAM ruoli per le fonti di dati Alfresco.

Puoi anche aggiungere le seguenti funzionalità opzionali:

  • Virtual Private Cloud (VPC): VpcConfiguration specifica quando si chiama. CreateDataSource Per ulteriori informazioni, consulta Configurazione Amazon Kendra per l'utilizzo di un Amazon VPC.

  • Tipo di contenuto: il tipo di contenuto che desideri sottoporre a scansione, che si tratti di contenuti contrassegnati con «Aspetti» inAlfresco, contenuti all'interno di un Alfresco sito specifico o contenuti in tutti i tuoi siti. Alfresco Puoi anche elencare contenuti «Aspetti» specifici.

  • Filtri di inclusione ed esclusione: specifica se includere o escludere determinati file.

    Nota

    La maggior parte delle fonti di dati utilizza modelli di espressioni regolari, che sono modelli di inclusione o esclusione denominati filtri. Se si specifica un filtro di inclusione, viene indicizzato solo il contenuto che corrisponde al filtro di inclusione. Qualsiasi documento che non corrisponde al filtro di inclusione non viene indicizzato. Se si specifica un filtro di inclusione ed esclusione, i documenti che corrispondono al filtro di esclusione non vengono indicizzati, anche se corrispondono al filtro di inclusione.

  • Modalità di sincronizzazione: specifica come Amazon Kendra aggiornare l'indice quando il contenuto dell'origine dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione. Puoi scegliere tra:

    • FORCED_FULL_CRAWLper indicizzare nuovamente tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

    • FULL_CRAWLper indicizzare solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

  • Identity crawler: specifica se attivare il crawler Amazon Kendra di identità. Il crawler di identità utilizza le informazioni dell'elenco di controllo degli accessi (ACL) per i documenti per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Se disponi di un ACL per i tuoi documenti e scegli di utilizzarlo, puoi anche scegliere di attivare il crawler di identità per configurare il filtraggio Amazon Kendra del contesto utente dei risultati di ricerca. Altrimenti, se il crawler di identità è disattivato, tutti i documenti possono essere ricercati pubblicamente. Se desideri utilizzare il controllo degli accessi per i tuoi documenti e il crawler di identità è disattivato, in alternativa puoi utilizzare l'PutPrincipalMappingAPI per caricare le informazioni di accesso di utenti e gruppi per il filtraggio del contesto degli utenti.

  • Mappature dei campi: scegliete di mappare i campi delle sorgenti dati di Alfresco ai campi indice. Amazon Kendra Per ulteriori informazioni, consulta la sezione Mappatura dei campi di origine dei dati.

    Nota

    Il campo del corpo del documento o l'equivalente del corpo del documento per i documenti è necessario per Amazon Kendra effettuare la ricerca nei documenti. È necessario mappare il nome del campo del corpo del documento nella fonte dati al nome del campo indice_document_body. Tutti gli altri campi sono facoltativi.

Per un elenco di altre importanti chiavi JSON da configurare, consulta lo schema Alfresco del modello.

Ulteriori informazioni

Per saperne di più sull'integrazione Amazon Kendra con la tua fonte di dati Alfresco, consulta: