Panoramica dei vettori - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Panoramica dei vettori

I vettori sono rappresentazioni numeriche che aiutano le macchine a comprendere ed elaborare i dati. Nell'intelligenza artificiale generativa, hanno due scopi principali:

  • Rappresentano spazi latenti che acquisiscono la struttura dei dati in forma compressa

  • Creazione di incorporamenti per dati come parole, frasi e immagini

I modelli di incorporamento come Word2Vec GloVee Amazon Titan Text Embeddings convertono i dati in vettori tramite un processo chiamato incorporamento. Questi modelli di incorporamento possono fare quanto segue:

  • Impara dal contesto per rappresentare le parole come vettori.

  • Posiziona parole simili più vicine tra loro nello spazio vettoriale.

  • Consenti alle macchine di elaborare i dati in uno spazio continuo.

Il diagramma seguente fornisce una panoramica di alto livello del processo di incorporamento:

  1. Un bucket Amazon Simple Storage Service (Amazon S3) Simple Storage Service (Amazon S3) contiene file che sono le fonti di dati da cui il sistema legge ed elabora le informazioni. Il bucket S3 viene specificato durante la configurazione della knowledge base di Amazon Bedrock, che include anche la sincronizzazione dei dati con la knowledge base.

  2. Il modello di incorporamento converte i dati grezzi dai file oggetto nel bucket S3 in incorporamenti vettoriali. Ad esempio, Object1 viene convertito in un vettore [0.6, 0.7,...], che ne rappresenta il contenuto in uno spazio multidimensionale.

Il modello di incorporamento converte gli oggetti nel bucket Amazon S3 in incorporamenti vettoriali.

Gli incorporamenti di testi sono fondamentali per l'elaborazione del linguaggio naturale (NLP) perché svolgono le seguenti funzioni:

  • Cattura le relazioni semantiche tra le parole.

  • Abilita la generazione di testo contestualmente rilevante.

  • Potenzia modelli linguistici di grandi dimensioni (LLMs) per produrre risposte simili a quelle umane.