翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ベクトルの概要
ベクトルは、マシンがデータを理解して処理するのに役立つ数値表現です。生成 AI では、2 つの主要な目的があります。
-
データ構造を圧縮形式でキャプチャする潜在スペースを表す
-
単語、文、画像などのデータの埋め込みの作成
Word2Vec
-
コンテキストから学び、単語をベクトルとして表現します。
-
同様の単語をベクトル空間に近づけます。
-
マシンが連続スペース内のデータを処理できるようにします。
次の図は、埋め込みプロセスの概要を示しています。
-
Amazon Simple Storage Service (Amazon S3) バケットには、システムが情報を読み取って処理するデータソースであるファイルが含まれています。S3 バケットは、Amazon Bedrock ナレッジベース設定中に指定されます。これには、ナレッジベースとのデータの同期も含まれます。
-
埋め込みモデルは、S3 バケット内のオブジェクトファイルからの raw データをベクトル埋め込みに変換します。たとえば、Object1 はベクトル [0.6、0.7、...] に変換され、多次元空間内のコンテンツを表します。

単語の埋め込みは、自然言語処理 (NLP) では以下を行うため、重要です。
-
単語間のセマンティック関係をキャプチャします。
-
コンテキストに関連するテキストの生成を有効にします。
-
大規模言語モデル (LLMs) を強化して人間のようなレスポンスを生成します。