Amazon FSx (Finestre) - Amazon Kendra

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Amazon FSx (Finestre)

Amazon FSx (Windows) è un sistema di file server completamente gestito e basato sul cloud che offre funzionalità di archiviazione condivise. Se sei un utente Amazon FSx (Windows), puoi utilizzarlo Amazon Kendra per indicizzare la tua fonte di dati Amazon FSx (Windows).

Nota

Amazon Kendra ora supporta un connettore aggiornato Amazon FSx (Windows).

La console è stata aggiornata automaticamente per te. Tutti i nuovi connettori creati sulla console utilizzeranno l'architettura aggiornata. Se utilizzi l'API, ora devi utilizzare l'TemplateConfigurationoggetto anziché l'FSxConfigurationoggetto per configurare il connettore.

I connettori configurati utilizzando la console e l'architettura API precedenti continueranno a funzionare come configurato. Tuttavia, non potrai modificarli o aggiornarli. Se desideri modificare o aggiornare la configurazione del connettore, devi creare un nuovo connettore.

Ti consigliamo di migrare il flusso di lavoro del connettore alla versione aggiornata. La fine del supporto per i connettori configurati utilizzando l'architettura precedente è prevista entro giugno 2024.

Puoi connetterti Amazon Kendra alla tua fonte di dati Amazon FSx (Windows) utilizzando la Amazon Kendra console o l'TemplateConfigurationAPI.

Per la risoluzione dei problemi relativi al connettore di origine dati Amazon Kendra Amazon FSx (Windows), consultaRisoluzione dei problemi relativi alle origini dati.

Funzionalità supportate

Amazon Kendra Amazon FSx Il connettore di origine dati (Windows) supporta le seguenti funzionalità:

  • Mappature dei campi

  • Controllo degli accessi degli utenti

  • Scansione delle identità degli utenti

  • Filtri di inclusione ed esclusione

  • Sincronizzazione completa e incrementale dei contenuti

  • Virtual Private Cloud (VPC) (Cloud privato virtuale (VPC)

Prerequisiti

Prima di poterla utilizzare Amazon Kendra per indicizzare la tua fonte di dati Amazon FSx (Windows), controlla i dettagli della tua fonte di dati Amazon FSx (Windows) e. Account AWS

Per Amazon FSx (Windows), assicurati di avere:

  • Configurazione Amazon FSx (Windows) con autorizzazioni di lettura e montaggio.

  • Ha annotato l'ID del file system. È possibile trovare l'ID del file system nella dashboard dei file system della console Amazon FSx (Windows).

  • Hai configurato un cloud privato virtuale utilizzando il Amazon VPC luogo in cui risiede il tuo file system Amazon FSx (Windows).

  • Ha annotato le credenziali di autenticazione Amazon FSx (Windows) per un account Active Directory utente. Ciò include il nome utente di Active Directory con il nome di dominio DNS (ad esempio, user@corp.example.com) e la password.

    Nota

    Utilizza solo le credenziali necessarie per il funzionamento del connettore. Non utilizzare credenziali privilegiate come l'amministratore di dominio.

    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

  • Selezionato, ogni documento è unico in Amazon FSx (Windows) e tra le altre fonti di dati che intendi utilizzare per lo stesso indice. Ogni fonte di dati che desideri utilizzare per un indice non deve contenere lo stesso documento in tutte le fonti di dati. Gli ID dei documenti sono globali rispetto a un indice e devono essere univoci per indice.

Nel tuo Account AWS, assicurati di avere:

  • Ha creato un Amazon Kendra indice e, se si utilizza l'API, ha annotato l'ID dell'indice.

  • Hai creato un IAM ruolo per la tua origine dati e, se utilizzi l'API, hai annotato l'ARN del IAM ruolo.

    Nota

    Se modifichi il tipo di autenticazione e le credenziali, devi aggiornare il IAM ruolo per accedere all'ID AWS Secrets Manager segreto corretto.

  • Ha archiviato le credenziali di autenticazione Amazon FSx (Windows) in un AWS Secrets Manager segreto e, se si utilizza l'API, ha annotato l'ARN del segreto.

    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

Se non disponi di un IAM ruolo o di un segreto esistente, puoi utilizzare la console per creare un nuovo IAM ruolo e un Secrets Manager segreto quando connetti la tua origine dati Amazon FSx (Windows) a. Amazon Kendra Se utilizzi l'API, devi fornire l'ARN di un IAM ruolo e di un Secrets Manager segreto esistenti e un ID di indice.

Istruzioni di connessione

Per connettersi Amazon Kendra all'origine dati Amazon FSx (Windows), è necessario fornire i dettagli necessari dell'origine dati Amazon FSx (Windows) in modo che sia Amazon Kendra possibile accedere ai dati. Se non hai ancora configurato Amazon FSx (Windows) per Amazon Kendra, vediPrerequisiti.

Console

Per connettersi Amazon Kendra al file system Amazon FSx (Windows)

  1. Accedi a AWS Management Console e apri la Amazon Kendra console.

  2. Dal riquadro di navigazione a sinistra, scegli Indici, quindi scegli l'indice che desideri utilizzare dall'elenco degli indici.

    Nota

    Puoi scegliere di configurare o modificare le impostazioni del controllo dell'accesso degli utenti in Impostazioni dell'indice.

  3. Nella pagina Guida introduttiva, scegli Aggiungi origine dati.

  4. Nella pagina Aggiungi origine dati, scegli Connettore Amazon FSx (Windows), quindi scegli Aggiungi connettore. Se utilizzi la versione 2 (se applicabile), scegli il connettore Amazon FSx (Windows) con il tag «V2.0".

  5. Nella pagina Specificare i dettagli dell'origine dati, inserisci le seguenti informazioni:

    1. In Nome e descrizione, per Nome dell'origine dati, inserisci un nome per l'origine dati. Puoi includere trattini ma non spazi.

    2. (Facoltativo) Descrizione: immetti una descrizione facoltativa per la tua fonte di dati.

    3. In Lingua predefinita: scegli una lingua per filtrare i documenti per l'indice. Se non diversamente specificato, la lingua predefinita è l'inglese. La lingua specificata nei metadati del documento ha la precedenza sulla lingua selezionata.

    4. In Tag, per Aggiungi nuovo tag, includi tag opzionali per cercare e filtrare le risorse o tenere traccia dei costi. AWS

    5. Seleziona Successivo.

  6. Nella pagina Definisci accesso e sicurezza, inserisci le seguenti informazioni:

    1. Amazon FSx (Windows) ID del file system: seleziona dal menu a discesa l'ID del file system esistente, recuperato da Amazon FSx (Windows). Oppure, crea un file system Amazon FSx (Windows). Puoi trovare l'ID del tuo file system nella dashboard dei file system della console Amazon FSx (Windows).

    2. Autorizzazione: attiva o disattiva le informazioni dell'elenco di controllo degli accessi (ACL) per i documenti, se disponi di un ACL e desideri utilizzarlo per il controllo degli accessi. L'ACL specifica a quali documenti possono accedere utenti e gruppi. Le informazioni ACL vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.

    3. Autenticazione: scegli un AWS Secrets Manager segreto esistente o crea un nuovo segreto per archiviare le credenziali del file system. Se scegli di creare un nuovo segreto, si apre una finestra AWS Secrets Manager segreta.

      Fornisci un segreto che memorizzi le credenziali di autenticazione del nome utente e della password. Il nome utente deve includere il nome di dominio DNS. Ad esempio, user@corp.example.com.

      Salva e aggiungi il tuo segreto.

    4. Virtual Private Cloud (VPC): è necessario selezionare un Amazon VPC luogo in cui risiede (Windows). Amazon FSx Includi la sottorete VPC e i gruppi di sicurezza. Vedi Configurazione di un. Amazon VPC

    5. IAM ruolo: scegli un ruolo esistente o crea un nuovo IAM IAM ruolo per accedere alle credenziali del repository e indicizzare il contenuto.

      Nota

      IAM i ruoli utilizzati per gli indici non possono essere utilizzati per le fonti di dati. Se non sei sicuro che un ruolo esistente venga utilizzato per un indice o una FAQ, scegli Crea un nuovo ruolo per evitare errori.

    6. Seleziona Successivo.

  7. Nella pagina Configura le impostazioni di sincronizzazione, inserisci le seguenti informazioni:

    1. Ambito di sincronizzazione, modelli Regex: aggiungi modelli di espressioni regolari per includere o escludere determinati file.

    2. Modalità di sincronizzazione: scegli come aggiornare l'indice quando il contenuto della fonte di dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione.

      • Sincronizzazione completa: indicizza di nuovo tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

      • Sincronizzazione nuova, modificata ed eliminata: indicizza solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

    3. Pianificazione dell'esecuzione della sincronizzazione: per Frequenza, scegli la frequenza con cui sincronizzare il contenuto della fonte di dati e aggiornare l'indice.

    4. Seleziona Successivo.

  8. Nella pagina Imposta mappature dei campi, inserisci le seguenti informazioni:

    1. Seleziona tra i campi predefiniti Amazon Kendra generati dei tuoi file che desideri mappare all'indice. Per aggiungere campi di origine dati personalizzati, crea un nome di campo indice a cui mappare e il tipo di dati del campo.

    2. Seleziona Successivo.

  9. Nella pagina Rivedi e crea, verifica che le informazioni inserite siano corrette, quindi seleziona Aggiungi origine dati. Puoi anche scegliere di modificare le tue informazioni da questa pagina. L'origine dati verrà visualizzata nella pagina Origini dati dopo che l'origine dati sarà stata aggiunta correttamente.

API

Per connettersi Amazon Kendra al file system Amazon FSx (Windows)

È necessario specificare un codice JSON dello schema dell'origine dati utilizzando l'TemplateConfigurationAPI. È necessario fornire le seguenti informazioni:

  • Origine dati: specifica il tipo di origine dati come FSX quando usi lo schema TemplateConfigurationJSON. Specificate anche l'origine dati come TEMPLATE quando chiamate l'CreateDataSourceAPI.

  • ID del file system: l'identificatore del file system Amazon FSx (Windows). È possibile trovare l'ID del file system nella dashboard dei file system della console Amazon FSx (Windows).

  • Tipo di file system: specifica il tipo di file system. WINDOWS

  • Virtual Private Cloud (VPC): VpcConfiguration specifica quando si chiama. CreateDataSource Per ulteriori informazioni, consulta Configurazione Amazon Kendra per l'utilizzo di un Amazon VPC.

    Nota

    È necessario selezionare un Amazon VPC luogo in cui risiede Amazon FSx (Windows). Includi la sottorete VPC e i gruppi di sicurezza.

  • Modalità di sincronizzazione: specifica come Amazon Kendra aggiornare l'indice quando il contenuto dell'origine dati cambia. Quando sincronizzi l'origine dati con Amazon Kendra per la prima volta, tutto il contenuto viene sottoposto a scansione e indicizzato per impostazione predefinita. Se la sincronizzazione iniziale non è riuscita, devi eseguire una sincronizzazione completa dei dati, anche se non scegli la sincronizzazione completa come opzione della modalità di sincronizzazione. Puoi scegliere tra:

    • FORCED_FULL_CRAWLper indicizzare nuovamente tutti i contenuti, sostituendo i contenuti esistenti ogni volta che l'origine dati si sincronizza con l'indice.

    • FULL_CRAWLper indicizzare solo i contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con l'indice. Amazon Kendra può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti e indicizzare i contenuti modificati dall'ultima sincronizzazione.

  • Identity crawler: specifica se attivare il crawler Amazon Kendra di identità. Il crawler di identità utilizza le informazioni dell'elenco di controllo degli accessi (ACL) per i documenti per filtrare i risultati della ricerca in base all'accesso dell'utente o del gruppo di appartenenza ai documenti. Se disponi di un ACL per i tuoi documenti e scegli di utilizzarlo, puoi anche scegliere di attivare il crawler di identità per configurare il filtraggio Amazon Kendra contestuale dell'utente dei risultati di ricerca. Altrimenti, se il crawler di identità è disattivato, tutti i documenti possono essere ricercati pubblicamente. Se desideri utilizzare il controllo degli accessi per i tuoi documenti e il crawler di identità è disattivato, in alternativa puoi utilizzare l'PutPrincipalMappingAPI per caricare le informazioni di accesso di utenti e gruppi per il filtraggio del contesto degli utenti.

  • Secret Amazon Resource Name (ARN): fornisci l'Amazon Resource Name (ARN) di un Secrets Manager segreto che contiene le credenziali di autenticazione per il tuo account (Windows). Amazon FSx Il segreto è archiviato in una struttura JSON con le seguenti chiavi:

    { "username": "user@corp.example.com", "password": "password" }
  • IAM ruolo: specifica RoleArn quando chiami CreateDataSource per fornire a un IAM ruolo le autorizzazioni per accedere al tuo Secrets Manager segreto e per chiamare le API pubbliche richieste per il connettore Amazon FSx (Windows) e. Amazon Kendra Per ulteriori informazioni, consulta IAM i ruoli per le origini dati Amazon FSx (Windows).

Puoi anche aggiungere le seguenti funzionalità opzionali:

  • Filtri di inclusione ed esclusione: specificano se includere o escludere determinati file.

    Nota

    La maggior parte delle fonti di dati utilizza modelli di espressioni regolari, che sono modelli di inclusione o esclusione denominati filtri. Se si specifica un filtro di inclusione, viene indicizzato solo il contenuto che corrisponde al filtro di inclusione. Qualsiasi documento che non corrisponde al filtro di inclusione non viene indicizzato. Se si specifica un filtro di inclusione ed esclusione, i documenti che corrispondono al filtro di esclusione non vengono indicizzati, anche se corrispondono al filtro di inclusione.

  • Elenco di controllo degli accessi (ACL): specifica se eseguire la scansione delle informazioni ACL per i documenti, se disponi di un ACL e desideri utilizzarlo per il controllo degli accessi. L'ACL specifica a quali documenti possono accedere utenti e gruppi. Le informazioni ACL vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.

    Nota

    Per testare il filtraggio del contesto utente su un utente, è necessario includere il nome di dominio DNS come parte del nome utente quando si esegue la query. È necessario disporre delle autorizzazioni amministrative del dominio Active Directory. È inoltre possibile testare il filtraggio del contesto utente in base al nome di un gruppo.

  • Mappature dei campi: scegli di mappare i campi dell'origine dati Amazon FSx (Windows) ai campi indice. Amazon Kendra Per ulteriori informazioni, consulta la sezione Mappatura dei campi di origine dei dati.

    Nota

    Il campo del corpo del documento o l'equivalente del corpo del documento per i documenti è necessario per Amazon Kendra eseguire la ricerca nei documenti. È necessario mappare il nome del campo del corpo del documento nella fonte dati al nome del campo indice_document_body. Tutti gli altri campi sono facoltativi.

Per un elenco di altre importanti chiavi JSON da configurare, consulta lo schema del modello Amazon FSx (Windows).

Ulteriori informazioni

Per ulteriori informazioni sull'integrazione Amazon Kendra con la tua fonte di dati Amazon FSx (Windows), consulta: