Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Mappatura dei campi delle sorgenti dati
Amazon Kendra i connettori di origine dati possono mappare i campi del documento o del contenuto dall'origine dati ai campi del Amazon Kendra indice. Per impostazione predefinita, ogni connettore è progettato per eseguire la scansione di campi di origine dati specifici. I campi di origine dati predefiniti e le relative proprietà non possono essere modificati o personalizzati. Sul Amazon Kendra console, i campi predefiniti e le proprietà dei campi predefiniti che non possono essere modificati sono disattivati.
Amazon Kendra i connettori consentono inoltre di mappare campi di documento o contenuto personalizzati dalla fonte di dati ai campi personalizzati dell'indice. Ad esempio, se nella fonte dati è presente un campo chiamato «reparto» che contiene informazioni sul reparto per un documento, è possibile mapparlo a un campo indice chiamato «Dipartimento». In questo modo, puoi utilizzare il campo per interrogare i documenti.
Puoi anche mappare Amazon Kendra campi riservati o comuni come_created_at
. Se la tua fonte di dati ha un campo chiamato «creation_date», puoi mapparlo all'equivalente Amazon Kendra campo riservato chiamato. _created_at
Per ulteriori informazioni su Amazon Kendra campi riservati, vedi Attributi o campi del documento.
Puoi mappare i campi per la maggior parte delle fonti di dati. È possibile creare mappature dei campi per le seguenti fonti di dati:
-
Adobe Experience Manager
-
Alfresco
-
Aurora (Mia) SQL
-
Aurora (Postgres) SQL
-
Amazon FSx (Windows)
-
Amazon FSx (NetApp ONTAP)
-
RDSAmazon/Aurora
-
Amazon RDS (Microsoft SQL Server)
-
Amazon RDS (Il mioSQL)
-
Amazon RDS (Oracle)
-
Amazon RDS (Poster) SQL
-
Amazon Kendra Web crawler
-
Amazon WorkDocs
-
Box (Cubo)
-
Confluence
-
Dropbox
-
Drupal
-
GitHub
-
Unità Google Workspace
-
Gmail
-
IBM DB2
-
Jira
-
Microsoft Exchange
-
Microsoft OneDrive
-
Microsoft SharePoint
-
Microsoft Teams
-
Microsoft SQL Server
-
Microsoft Yammer
-
Mio SQL
-
Oracle Database
-
Poster SQL
-
battuta
-
Salesforce
-
ServiceNow
-
Slack
-
Zendesk
Se memorizzi i tuoi documenti in un bucket S3 o in una fonte di dati S3, specifichi i campi utilizzando un file di metadati. JSON Per ulteriori informazioni, consulta S3 Data Source Connector.
La mappatura dei campi della sorgente dati su un campo indice è un processo in tre fasi:
-
Creare un indice. Per ulteriori informazioni, vedere Creazione di un indice.
-
Aggiorna l'indice per aggiungere campi.
-
Crea una fonte di dati e includi le mappature dei campi per mappare i campi riservati e qualsiasi campo personalizzato a Amazon Kendra campi indice.
Per aggiornare l'indice per aggiungere campi personalizzati, usa la console per modificare le mappature dei campi dell'origine dati e aggiungi un campo personalizzato oppure usa. UpdateIndexAPI Puoi aggiungere un totale di 500 campi personalizzati al tuo indice.
Per le origini dati del database, se il nome della colonna del database corrisponde al nome di un campo riservato, il campo e la colonna vengono mappati automaticamente.
Con UpdateIndexAPI, si aggiungono campi riservati e personalizzati utilizzandoDocumentMetadataConfigurationUpdates
.
L'JSONesempio seguente utilizza DocumentMetadataConfigurationUpdates
per aggiungere un campo chiamato «Dipartimento» all'indice.
"DocumentmetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE" } ]
Quando crei il campo, hai la possibilità di impostare il modo in cui il campo viene utilizzato per la ricerca. Puoi scegliere tra le seguenti opzioni:
-
Visualizzabile: determina se il campo viene restituito nella risposta alla query. Il valore predefinito è
true
. -
Facetable: indica che il campo può essere utilizzato per creare sfaccettature. Il valore predefinito è
false
. -
Ricercabile: determina se il campo viene utilizzato nella ricerca. L'impostazione predefinita è
true
per i campi stringa efalse
per i campi numero e data. -
Ordinabile: indica che il campo può essere utilizzato per ordinare la risposta di una query. Può essere impostato solo per i campi di data, numero e stringa. Non può essere impostato per i campi dell'elenco di stringhe.
L'JSONesempio seguente utilizza l'aggiunta DocumentMetadataConfigurationUpdates
di un campo chiamato «Department» all'indice e lo contrassegna come facetable.
"DocumentMetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE", "Search": { "Facetable": true } } ]
Utilizzo Amazon Kendra campi di documento riservati o comuni
Con UpdateIndex API, è possibile creare campi riservati o comuni utilizzando DocumentMetadataConfigurationUpdates
e specificando il Amazon Kendra nome del campo indice riservato da mappare all'attributo/nome di campo del documento equivalente. Puoi anche creare campi personalizzati. Se si utilizza un connettore di origine dati, la maggior parte include mappature di campo che mappano i campi del documento di origine dati a Amazon Kendra campi indice. Se utilizzi la console, aggiorni i campi selezionando l'origine dati, selezionando l'azione di modifica e quindi procedendo accanto alla sezione delle mappature dei campi per configurare l'origine dati.
Puoi configurare l'Search
oggetto per impostare un campo come visualizzabile, personalizzabile, ricercabile e ordinabile. È possibile configurare l'Relevance
oggetto per impostare l'ordine di classificazione, la durata dell'aumento o il periodo di tempo di un campo da applicare a boosting, freshness, value di importanza e valori di importanza mappati a valori di campo specifici. Se utilizzi la console, puoi configurare le impostazioni di ricerca per un campo selezionando l'opzione facet nel menu di navigazione. Per impostare l'ottimizzazione della pertinenza, seleziona l'opzione di ricerca nell'indice nel menu di navigazione, inserisci una query e utilizza le opzioni del pannello laterale per ottimizzare la pertinenza della ricerca. Non è possibile modificare il tipo di campo dopo averlo creato.
Amazon Kendra contiene i seguenti campi di documento riservati o comuni che è possibile utilizzare:
-
_authors
—Un elenco di uno o più autori responsabili del contenuto del documento. -
_category
—Una categoria che colloca un documento in un gruppo specifico. -
_created_at
—La data e l'ora in formato ISO 8601 in cui è stato creato il documento. Ad esempio, 2012-03-25T 12:30:10 + 01:00 è il formato data-ora ISO 8601 per il 25 marzo 2012 alle 12:30 (più 10 secondi) nell'ora dell'Europa centrale. -
_data_source_id
—L'identificatore della fonte di dati che contiene il documento. -
_document_body
—Il contenuto del documento. -
_document_id
—Un identificatore univoco per il documento. -
_document_title
—Il titolo del documento. -
_excerpt_page_number
—Il numero di pagina in un PDF file in cui viene visualizzato l'estratto del documento. Se l'indice è stato creato prima dell'8 settembre 2020, è necessario reindicizzare i documenti prima di poter utilizzare questo attributo. -
_faq_id
—Se si tratta di un documento di tipo domanda-risposta (FAQ), un identificatore univoco per. FAQ -
_file_type
—Il tipo di file del documento, ad esempio pdf o doc. -
_last_updated_at
—La data e l'ora in formato ISO 8601 dell'ultimo aggiornamento del documento. Ad esempio, 2012-03-25T 12:30:10 + 01:00 è il formato data-ora ISO 8601 per il 25 marzo 2012 alle 12:30 (più 10 secondi) nell'ora dell'Europa centrale. -
_source_uri
—Il luogo in cui è disponibile il documento. URI Ad esempio, la visualizzazione URI del documento sul sito Web di un'azienda. -
_version
—Un identificatore per la versione specifica di un documento. -
_view_count
—Il numero di volte in cui il documento è stato visualizzato. -
_language_code
(String) —Il codice per una lingua che si applica al documento. Il valore predefinito è l'inglese se non si specifica una lingua. Per ulteriori informazioni sulle lingue supportate, compresi i relativi codici, consulta Aggiungere documenti in lingue diverse dall'inglese.
Per i campi personalizzati, puoi creare questi campi utilizzando DocumentMetadataConfigurationUpdates
con UpdateIndex
API, proprio come quando crei un campo riservato o comune. È necessario impostare il tipo di dati appropriato per il campo personalizzato. Se utilizzi la console, aggiorni i campi selezionando l'origine dati, selezionando l'azione di modifica e quindi procedendo accanto alla sezione delle mappature dei campi per configurare l'origine dati. Alcune fonti di dati non supportano l'aggiunta di nuovi campi o campi personalizzati. Non è possibile modificare il tipo di campo dopo averlo creato.
Di seguito sono riportati i tipi che è possibile impostare per i campi personalizzati:
-
Data
-
Numero
-
Stringa
-
Elenco stringhe
Se hai aggiunto documenti all'indice utilizzando BatchPutDocumentAPI, Attributes
elenca i campi/gli attributi dei tuoi documenti e crei campi utilizzando l'oggetto. DocumentAttribute
Per i documenti indicizzati da un Amazon S3 origine dati, si creano campi utilizzando un file di JSON metadati che include le informazioni sui campi.
Se utilizzi un database supportato come fonte di dati, puoi configurare i campi utilizzando l'opzione di mappatura dei campi.