Gestire un'origine dati - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Gestire un'origine dati

Dopo aver creato un'origine dati, puoi visualizzarne i dettagli, aggiornarla o eliminarla.

Visualizza informazioni su un'origine dati

Puoi visualizzare le informazioni sulla tua origine dati e la relativa cronologia di sincronizzazione. Seleziona la scheda corrispondente al metodo scelto e segui i passaggi.

Console
Per visualizzare informazioni su una fonte di dati
  1. Accedi a e apri AWS Management Console la console Amazon Bedrock all'indirizzo https://console.aws.amazon.com/bedrock/.

  2. Seleziona Knowledge base nel riquadro di navigazione a sinistra.

  3. Nella sezione Origine dati, seleziona l'origine dati di cui desideri visualizzare i dettagli.

  4. La panoramica dell'origine dati contiene dettagli sull'origine dati.

  5. La cronologia di sincronizzazione contiene dettagli su quando l'origine dati è stata sincronizzata. Per vedere i motivi per cui un evento di sincronizzazione non è riuscito, seleziona un evento di sincronizzazione e scegli Visualizza avvisi.

API

Per ottenere informazioni su un'origine dati, invia una GetDataSourcerichiesta a un endpoint di compilazione Agents for Amazon Bedrock e specifica l'indirizzo dataSourceId e la base knowledgeBaseId di conoscenza a cui appartiene.

Per elencare informazioni sulle fonti di dati di una knowledge base, invia una ListDataSourcesrichiesta a un endpoint di compilazione Agents for Amazon Bedrock e specifica l'ID della knowledge base.

  • Per impostare il numero massimo di risultati da restituire in una risposta, utilizza il campo. maxResults

  • Se i risultati sono superiori al numero impostato, la risposta restituisce unnextToken. È possibile utilizzare questo valore in un'altra ListDataSources richiesta per visualizzare il successivo batch di risultati.

Per ottenere informazioni su un evento di sincronizzazione per un'origine dati, invia una GetIngestionJobrichiesta a un endpoint in fase di costruzione di Agents for Amazon Bedrock. Specificare il, e. dataSourceId knowledgeBaseId ingestionJobId

Per elencare la cronologia di sincronizzazione di un'origine dati in una knowledge base, invia una ListIngestionJobsrichiesta a un endpoint in fase di costruzione di Agents for Amazon Bedrock. Definizione dell'ID della knowledge base e dell'origine dati. Puoi impostare le seguenti specifiche.

  • Filtra i risultati specificando lo stato da cercare nell'oggetto filters.

  • Ordina in base all'ora di avvio del processo o allo stato di un processo specificando l'oggetto sortBy. Puoi scegliere l'ordinamento crescente o decrescente.

  • Puoi impostare il numero massimo di risultati che dovranno essere restituiti nella risposta nel campo maxResults. Se i risultati sono superiori al numero impostato, la risposta restituisce un messaggio nextToken che puoi inviare in un'altra ListIngestionJobsrichiesta per visualizzare il successivo batch di lavori.

Aggiorna un'origine dati

Puoi aggiornare un'origine dati nei seguenti modi:

  • Aggiungi, modifica o rimuovi file dal bucket S3 che contiene i file per l'origine dati.

  • Cambia il nome o il bucket S3 per l'origine dati o la chiave KMS da utilizzare per crittografare i dati transitori durante l'ingestione dei dati.

  • Imposta la politica di eliminazione della fonte di dati in modo da eliminare o conservare. Se è impostata su delete, tutti i dati sottostanti appartenenti all'origine dati dal vector store vengono eliminati quando si elimina una knowledge base o una risorsa di origine dati. Se è impostato su retention, tutti i dati sottostanti appartenenti alla fonte dati dal vector store vengono conservati quando si elimina una knowledge base o una risorsa di origine dati.

Ogni volta che aggiungi, modifichi o rimuovi file dal bucket S3 per un'origine dati, devi sincronizzare l'origine dati in modo che venga reindicizzata nella knowledge base. La sincronizzazione è incrementale, quindi Amazon Bedrock elabora solo gli oggetti nel bucket S3 che sono stati aggiunti, modificati o eliminati dall'ultima sincronizzazione. Prima di iniziare l'importazione, verifica che la fonte di dati soddisfi le seguenti condizioni:

  • I file sono nei formati supportati. Per ulteriori informazioni, consulta Configura un indice vettoriale per la tua knowledge base in un archivio vettoriale supportato.

  • I file non superano la dimensione massima di 50 MB. Per ulteriori informazioni, consulta Quote della Knowledge Base.

  • Se la fonte di dati contiene file di metadati, verifica le seguenti condizioni per assicurarti che i file di metadati non vengano ignorati:

    • Ogni .metadata.json file ha lo stesso nome del file sorgente a cui è associato.

    • Se l'indice vettoriale per la tua knowledge base si trova in un archivio vettoriale Amazon OpenSearch Serverless, verifica che l'indice vettoriale sia configurato con il motore. faiss Se l'indice vettoriale è configurato con il nmslib motore, dovrai eseguire una delle seguenti operazioni:

    • Se l'indice vettoriale per la tua knowledge base si trova in un cluster di database Amazon Aurora, verifica che la tabella dell'indice contenga una colonna per ogni proprietà dei metadati nei tuoi file di metadati prima di iniziare l'importazione.

Per sapere come aggiornare una fonte di dati, seleziona la scheda corrispondente al metodo che preferisci e segui i passaggi.

Console
Per aggiornare una fonte di dati
  1. (Facoltativo) Apporta le modifiche necessarie ai file nel bucket S3 che contiene i file per l'origine dati.

  2. Accedi a e apri AWS Management Console la console Amazon Bedrock all'indirizzo https://console.aws.amazon.com/bedrock/.

  3. Seleziona Knowledge base nel riquadro di navigazione a sinistra.

  4. Nella sezione Origine dati, seleziona il pulsante di opzione accanto all'origine dati che desideri sincronizzare.

  5. (Facoltativo) Scegli Modifica, modifica le configurazioni necessarie e seleziona Invia.

  6. (Facoltativo) Scegli di modificare la politica di eliminazione dei dati dell'origine dati come parte delle impostazioni avanzate:

    • Elimina: elimina tutti i dati sottostanti appartenenti all'origine dati dal vector store dopo l'eliminazione di una knowledge base o di una risorsa di origine dati. Nota che il vector store stesso non viene eliminato, ma solo i dati sottostanti. Questo flag viene ignorato se un AWS account viene eliminato.

    • Conserva: conserva tutti i dati sottostanti nell'archivio vettoriale dopo l'eliminazione di una knowledge base o di una risorsa di origine dati.

  7. Scegli Sincronizza.

  8. Quando la sincronizzazione è completa e lo stato diventa Pronto, viene visualizzato un banner verde.

API
Per aggiornare una fonte di dati
  1. (Facoltativo) Apporta le modifiche necessarie ai file nel bucket S3 che contiene i file per l'origine dati.

  2. (Facoltativo) Modifica dataDeletionPolicy la fonte dei dati. È possibile accedere a DELETE tutti i dati sottostanti appartenenti all'origine dati dal vector store dopo l'eliminazione di una knowledge base o di una risorsa di origine dati. Nota che il vector store stesso non viene eliminato, ma solo i dati sottostanti. Questo flag viene ignorato se un AWS account viene eliminato. È possibile utilizzare RETAIN tutti i dati sottostanti nel proprio archivio vettoriale dopo l'eliminazione di una knowledge base o di una risorsa di origine dati.

  3. (Facoltativo) Invia una UpdateDataSourcerichiesta a un endpoint in fase di costruzione di Agents for Amazon Bedrock, modificando le configurazioni necessarie e specificando le stesse configurazioni che non desideri modificare.

    Nota

    Non puoi modificare il. chunkingConfiguration Invia la richiesta con quella esistentechunkingConfiguration.

  4. Invia una StartIngestionJobrichiesta a un endpoint in fase di costruzione di Agents for Amazon Bedrock, specificando e. dataSourceId knowledgeBaseId

Eliminazione di un'origine dati

Se non hai più bisogno di una fonte di dati, puoi eliminarla. Seleziona la scheda corrispondente al metodo scelto e segui i passaggi.

Console
Per eliminare un'origine dati
  1. Accedi a e apri AWS Management Console la console Amazon Bedrock all'indirizzo https://console.aws.amazon.com/bedrock/.

  2. Seleziona Knowledge base nel riquadro di navigazione a sinistra.

  3. Nella sezione Origine dati, seleziona il pulsante di opzione accanto all'origine dati che desideri eliminare.

  4. Scegli Elimina.

  5. Quando l'origine dati viene eliminata con successo, viene visualizzato un banner verde.

    Nota

    La politica di eliminazione dei dati per l'origine dati è impostata su Elimina (elimina tutti i dati sottostanti quando si elimina l'origine dati) o Retain (conserva tutti i dati sottostanti quando si elimina l'origine dati). Se la politica di eliminazione dei dati dell'origine dati è impostata su Elimina, è possibile che l'origine dati completi senza successo il processo di eliminazione a causa di problemi con la configurazione o l'accesso al vector store. Puoi passare il mouse sullo stato «DELETE_UNSUCCESSFUL» per vedere il motivo per cui l'origine dati non è riuscita a eliminare.

API

Per eliminare una fonte di dati da una knowledge base, invia una DeleteDataSourcerichiesta, specificando e. dataSourceId knowledgeBaseId

Nota

La politica di eliminazione dei dati per l'origine dati è impostata su DELETE (elimina tutti i dati sottostanti quando si elimina l'origine dati) o RETAIN (conserva tutti i dati sottostanti quando si elimina l'origine dati). Se la politica di eliminazione dei dati dell'origine dati è impostata suDELETE, è possibile che l'origine dati completi senza successo il processo di eliminazione a causa di problemi di configurazione o di accesso al vector store. È possibile verificare failureReasons se lo stato dell'origine dati consente di DELETE_UNSUCCESSFUL vedere il motivo per cui l'origine dati non è stata eliminata correttamente.