OneDrive Connettore Microsoft V2.0 - Amazon Kendra

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

OneDrive Connettore Microsoft V2.0

Microsoft OneDrive è un servizio di archiviazione basato sul cloud che puoi utilizzare per archiviare, condividere e ospitare i tuoi contenuti. Puoi usarlo Amazon Kendra per indicizzare la tua fonte di OneDrive dati.

Puoi connetterti Amazon Kendra alla tua fonte di OneDrive dati utilizzando la Amazon Kendra console e l'OneDriveConfigurationAPI.

Nota

La fine del supporto per OneDrive Connector OneDriveConfiguration V1.0/API è prevista entro giugno 2023. Ti consigliamo di utilizzare OneDrive Connector TemplateConfiguration V2.0/API. La versione 2.0 offre ACL aggiuntivi e funzionalità di identity crawler.

Per la risoluzione dei problemi relativi al connettore di origine Amazon Kendra OneDrive dati, consulta. Risoluzione dei problemi relativi alle origini dati

Funzionalità supportate

Amazon Kendra OneDrive il connettore di origine dati supporta le seguenti funzionalità:

  • mappature dei campi

  • Controllo degli accessi degli utenti

  • Filtri di inclusione/esclusione

  • Sincronizzazione completa e incrementale dei contenuti

  • Virtual Private Cloud (VPC) (Cloud privato virtuale (VPC)

Prerequisiti

Prima di poterla utilizzare Amazon Kendra per indicizzare la tua fonte di OneDrive dati, apporta queste modifiche al tuo account OneDrive e AWS ai tuoi account.

Nel OneDrive, assicurati di avere:

  • Hai creato un OneDrive account in Office 365.

  • Ha preso nota del tuo ID tenant di Microsoft 365. Puoi trovare il tuo ID tenant nelle proprietà del tuo portale di Azure Active Directory o nell'applicazione OAuth.

  • Ha creato un'applicazione OAuth nel portale di Azure e ha annotato l'ID client e il segreto del client o le credenziali del client utilizzate per l'autenticazione con un segreto. AWS Secrets Manager Per ulteriori informazioni, consulta il tutorial Microsoft e l'esempio di app registrata.

    Nota

    Quando crei o registri un'app nel portale di Azure, l'ID segreto rappresenta il valore segreto effettivo. È necessario prendere nota o salvare il valore segreto effettivo immediatamente durante la creazione del segreto e dell'app. Puoi accedere al tuo segreto selezionando il nome dell'applicazione nel portale di Azure e quindi accedendo all'opzione di menu relativa a certificati e segreti.

    Puoi accedere al tuo ID cliente selezionando il nome dell'applicazione nel portale di Azure e quindi accedendo alla pagina di panoramica. L'ID dell'applicazione (client) è l'ID del client.

    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

  • Ha utilizzato l'ID dell'applicazione AD per registrare una chiave segreta per l'applicazione sul sito AD. La chiave segreta deve contenere l'ID dell'applicazione e una chiave segreta.

  • Ha copiato il dominio AD dell'organizzazione.

  • Sono state aggiunte le seguenti autorizzazioni all'applicazione AD nell'opzione Microsoft Graph:

    • Leggi i file in tutte le raccolte di siti (File.Read.All)

    • Leggi i profili completi di tutti gli utenti (User.Read.All)

    • Leggi tutti i gruppi (Group.Read.All)

    • Leggi tutte le note (Notes.Read.All)

  • È stato copiato l'elenco degli utenti i cui documenti devono essere indicizzati. È possibile scegliere di fornire un elenco di nomi utente oppure fornire i nomi utente in un file archiviato in un file. Amazon S3 Dopo aver creato l'origine dati, puoi:

    • Modificare l'elenco degli utenti.

    • Passa da un elenco di utenti a un elenco memorizzato in un Amazon S3 bucket.

    • Modifica la posizione del Amazon S3 bucket di un elenco di utenti. Se modifichi la posizione del bucket, devi anche aggiornare il IAM ruolo dell'origine dati in modo che abbia accesso al bucket.

      Nota

      Se memorizzi l'elenco dei nomi utente in un Amazon S3 bucket, la IAM politica per l'origine dati deve fornire l'accesso al bucket e l'accesso alla chiave con cui il bucket è stato crittografato, se presente.

      Il OneDrive connettore utilizza l'e-mail proveniente dalle informazioni di contatto presenti nelle proprietà utente di Onedrive. Assicurati che l'utente di cui desideri sottoporre a scansione i dati abbia il campo e-mail configurato nella pagina Informazioni di contatto, poiché per i nuovi utenti potrebbe essere vuoto.

Nel tuo AWS account, assicurati di avere:

  • Ha creato un Amazon Kendra indice e, se si utilizza l'API, ha annotato l'ID dell'indice.

  • Hai creato un IAM ruolo per la tua origine dati e, se utilizzi l'API, hai annotato l'ARN del IAM ruolo.

  • Ha archiviato le credenziali di OneDrive autenticazione in un AWS Secrets Manager segreto e, se si utilizza l'API, ha annotato l'ARN del segreto.

Se non disponi di un IAM ruolo o di un segreto esistente, puoi utilizzare la console per creare un nuovo IAM ruolo e un Secrets Manager segreto quando connetti la tua fonte di OneDrive dati a. Amazon Kendra Se si utilizza l'API, è necessario fornire l'ARN di un IAM ruolo e di un Secrets Manager segreto esistenti e un ID di indice.

Istruzioni di connessione

Per connetterti Amazon Kendra alla tua fonte di OneDrive dati devi fornire i dettagli delle tue OneDrive credenziali in modo da Amazon Kendra poter accedere ai tuoi dati. Se non hai ancora configurato OneDrive per Amazon Kendra, consultaPrerequisiti.

Console

Per connettersi Amazon Kendra a OneDrive

  1. Accedi a AWS Management Console e apri la Amazon Kendra console.

  2. Dal riquadro di navigazione a sinistra, scegli Indici, quindi scegli l'indice che desideri utilizzare dall'elenco degli indici.

    Nota

    Puoi scegliere di configurare o modificare le impostazioni del controllo dell'accesso degli utenti in Impostazioni dell'indice.

  3. Nella pagina Guida introduttiva, scegli Aggiungi origine dati.

  4. Nella pagina Aggiungi origine dati, scegli OneDrive connettore, quindi scegli Aggiungi connettore. Se utilizzi la versione 2 (se applicabile), scegli il OneDrive connettore con il tag «V2.0".

  5. Nella pagina Specificare i dettagli dell'origine dati, inserisci le seguenti informazioni:

    1. In Nome e descrizione, per Nome dell'origine dati, inserisci un nome per l'origine dati. Puoi includere trattini ma non spazi.

    2. (Facoltativo) Descrizione: immetti una descrizione facoltativa per l'origine dati.

    3. In Lingua predefinita: scegli una lingua per filtrare i documenti per l'indice. Se non diversamente specificato, la lingua predefinita è l'inglese. La lingua specificata nei metadati del documento ha la precedenza sulla lingua selezionata.

    4. In Tag, per Aggiungi nuovo tag, includi tag opzionali per cercare e filtrare le risorse o tenere traccia dei costi. AWS

    5. Seleziona Successivo.

  6. Nella pagina Definisci accesso e sicurezza, inserisci le seguenti informazioni:

    1. OneDrive ID tenant: inserire l'ID OneDrive tenant senza il protocollo.

    2. Autorizzazione: attiva o disattiva le informazioni dell'elenco di controllo degli accessi (ACL) per i documenti, se disponi di un ACL e desideri utilizzarlo per il controllo degli accessi. L'ACL specifica a quali documenti possono accedere utenti e gruppi. Le informazioni ACL vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.

    3. In Autenticazione: scegli tra Nuovo ed Esistente.

      1. Se scegli Esistente, seleziona un segreto esistente per Seleziona segreto.

      2. Se scegli Nuovo, inserisci le seguenti informazioni nella sezione Nuovo AWS Secrets Manager segreto:

        1. Nome segreto: un nome per il tuo segreto. Il prefisso 'AmazonKendra- OneDrive -' viene aggiunto automaticamente al nome segreto.

        2. Per Client ID e Client Secret: inserisci l'ID client e il segreto del client.

    4. Virtual Private Cloud (VPC): puoi scegliere di utilizzare un VPC. In tal caso, è necessario aggiungere sottoreti e gruppi di sicurezza VPC.

    5. Identity crawler: specifica se attivare il crawler di identità. Amazon Kendra Il crawler di identità utilizza le informazioni dell'elenco di controllo degli accessi (ACL) per i documenti per filtrare i risultati della ricerca in base all'accesso dell'utente o del gruppo di appartenenza ai documenti. Se disponi di un ACL per i tuoi documenti e scegli di utilizzarlo, puoi anche scegliere di attivare il crawler di identità per configurare il filtraggio Amazon Kendra del contesto utente dei risultati di ricerca. Altrimenti, se il crawler di identità è disattivato, tutti i documenti possono essere ricercati pubblicamente. Se desideri utilizzare il controllo degli accessi per i tuoi documenti e il crawler di identità è disattivato, in alternativa puoi utilizzare l'PutPrincipalMappingAPI per caricare le informazioni di accesso di utenti e gruppi per il filtraggio del contesto degli utenti.

    6. IAM ruolo: scegli un IAM ruolo esistente o creane uno nuovo IAM per accedere alle credenziali del repository e indicizzare il contenuto.

      Nota

      IAM i ruoli utilizzati per gli indici non possono essere utilizzati per le fonti di dati. Se non sei sicuro che un ruolo esistente venga utilizzato per un indice o una FAQ, scegli Crea un nuovo ruolo per evitare errori.

    7. Seleziona Successivo.

  7. Nella pagina Configura le impostazioni di sincronizzazione, inserisci le seguenti informazioni:

    1. Per l'ambito di sincronizzazione: scegli i OneDrive dati degli utenti da indicizzare. Puoi aggiungere un massimo di 10 utenti manualmente.

    2. Per configurazioni aggiuntive: aggiungi modelli di espressioni regolari per includere o escludere determinati contenuti. È possibile aggiungere fino a 100 pattern.

    3. Modalità di sincronizzazione: scegli come aggiornare l'indice quando il contenuto dell'origine dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione.

      • Sincronizzazione completa: indicizza di nuovo tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

      • Nuova sincronizzazione modificata: indicizza solo i contenuti nuovi e modificati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

      • Sincronizzazione nuova, modificata ed eliminata: indicizza solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

    4. Nella pianificazione di esecuzione della sincronizzazione, per Frequenza: scegli la frequenza con cui sincronizzare il contenuto della fonte di dati e aggiornare l'indice.

    5. Seleziona Successivo.

  8. Nella pagina Imposta mappature dei campi, inserisci le seguenti informazioni:

    1. Campi delle origini dati predefiniti: seleziona uno dei campi delle origini dati predefiniti Amazon Kendra generati che desideri mappare all'indice.

    2. Seleziona Successivo.

  9. Nella pagina Rivedi e crea, verifica che le informazioni che hai inserito siano corrette, quindi seleziona Aggiungi origine dati. Puoi anche scegliere di modificare le tue informazioni da questa pagina. L'origine dati verrà visualizzata nella pagina Origini dati dopo che l'origine dati sarà stata aggiunta correttamente.

API

Per connettersi Amazon Kendra a OneDrive

È necessario specificare un codice JSON dello schema dell'origine dati utilizzando l'TemplateConfigurationAPI. È necessario fornire le seguenti informazioni:

  • Origine dati: specifica il tipo di origine dati come ONEDRIVEV2 quando usi lo schema TemplateConfigurationJSON. Specificate anche l'origine dati come TEMPLATE quando chiamate l'CreateDataSourceAPI.

  • ID tenant: specifica l'ID tenant di Microsoft 365. Puoi trovare il tuo ID tenant nelle proprietà del tuo portale di Azure Active Directory o nell'applicazione OAuth.

  • Modalità di sincronizzazione: specifica come Amazon Kendra aggiornare l'indice quando il contenuto dell'origine dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione. Puoi scegliere tra:

    • FORCED_FULL_CRAWLper indicizzare nuovamente tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

    • FULL_CRAWLper indicizzare solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

    • CHANGE_LOGper indicizzare solo contenuti nuovi e modificati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

  • Secret Amazon Resource Name (ARN): fornisci l'Amazon Resource Name (ARN) di un Secrets Manager segreto che contiene le credenziali di autenticazione che hai creato nel tuo account. OneDrive

    Se utilizzi l'autenticazione OAuth 2.0, il segreto viene archiviato in una struttura JSON con le seguenti chiavi:

    { "clientId": "client ID", "clientSecret": "client secret" }
  • IAM ruolo: specifica RoleArn quando chiami CreateDataSource per fornire a un IAM ruolo le autorizzazioni per accedere al tuo Secrets Manager segreto e per chiamare le API pubbliche richieste per il connettore e. OneDrive Amazon Kendra Per ulteriori informazioni, consulta i IAM ruoli per OneDrive le fonti di dati.

Puoi anche aggiungere le seguenti funzionalità opzionali:

  • Virtual Private Cloud (VPC): VpcConfiguration specifica quando si chiama. CreateDataSource Per ulteriori informazioni, consulta Configurazione Amazon Kendra per l'utilizzo di un Amazon VPC.

  • Filtri di inclusione ed esclusione: è possibile specificare se includere o escludere determinati file, OneNote sezioni e pagine. OneNote

    Nota

    La maggior parte delle fonti di dati utilizza modelli di espressioni regolari, che sono modelli di inclusione o esclusione denominati filtri. Se si specifica un filtro di inclusione, viene indicizzato solo il contenuto che corrisponde al filtro di inclusione. Qualsiasi documento che non corrisponde al filtro di inclusione non viene indicizzato. Se si specifica un filtro di inclusione ed esclusione, i documenti che corrispondono al filtro di esclusione non vengono indicizzati, anche se corrispondono al filtro di inclusione.

  • Identity crawler: specifica se attivare il crawler di identità. Amazon Kendra Il crawler di identità utilizza le informazioni dell'elenco di controllo degli accessi (ACL) per i documenti per filtrare i risultati della ricerca in base all'accesso dell'utente o del gruppo di appartenenza ai documenti. Se disponi di un ACL per i tuoi documenti e scegli di utilizzarlo, puoi anche scegliere di attivare il crawler di identità per configurare il filtraggio Amazon Kendra del contesto utente dei risultati di ricerca. Altrimenti, se il crawler di identità è disattivato, tutti i documenti possono essere ricercati pubblicamente. Se desideri utilizzare il controllo degli accessi per i tuoi documenti e il crawler di identità è disattivato, in alternativa puoi utilizzare l'PutPrincipalMappingAPI per caricare le informazioni di accesso di utenti e gruppi per il filtraggio del contesto degli utenti.

  • Mappature dei campi: è possibile mappare solo i campi indice incorporati o comuni per il connettore. Amazon Kendra OneDrive La mappatura personalizzata dei campi non è disponibile per il OneDrive connettore a causa delle limitazioni dell'API. Per ulteriori informazioni, consulta la sezione Mappatura dei campi di origine dei dati.

Per un elenco di altre importanti chiavi JSON da configurare, consulta lo OneDrive schema del modello.