自動セマンティックエンリッチメントについて - Amazon OpenSearch Service

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

自動セマンティックエンリッチメントについて

コレクションを作成または編集するときに、自動セマンティックエンリッチメントを設定できます。これにより、Amazon OpenSearch Service でのセマンティック検索の実装と機能が簡素化されます。セマンティック検索は、キーワードマッチングだけでなく、ユーザーの検索のインテントとコンテキストの意味を組み込んだクエリ結果を返します。例えば、ユーザーが「どのように頭を悩ますか」を検索すると、セマンティック検索システムが次の結果を返す可能性があります。

  • Migraine の対策

  • ペイン管理手法

  • Over-the-counter緩和薬

  • 自然災害の軽減方法

これらの正確なフレーズが元のクエリにない場合でも、システムは基盤となるインテントを理解します。

自動セマンティックエンリッチメントには以下の利点があります。

実装の簡素化

機械学習 (ML) の専門知識や複雑な統合は必要ありません。

自動化プロセス

セマンティックエンリッチメントは、データ取り込み中に自動的に行われます。

検索の関連性の向上

セマンティックエンリッチメントは、検索結果の品質とコンテキストの精度を向上させます。

スケーラビリティ

セマンティックエンリッチメントは、手動操作なしでセマンティック検索を大規模なデータセットに適用します。

仕組み

自動セマンティックエンリッチメントを開始するには、コレクションを作成または編集し、データ内のセマンティック検索機能を必要とするフィールドを指定します。セマンティック検索のフィールドを特定した後、データが OpenSearch Service に入ると、自動セマンティックエンリッチメントプロセスによってこれらのフィールドが自動的に強化されます。強化されたデータにより、よりインテリジェントでコンテキスト対応の検索が可能になります。

注記

自動セマンティックエンリッチメントを実装するときは、次の要素を考慮してください。

  • 処理オーバーヘッド: エンリッチメントプロセスにより、取り込み中の処理時間が増える場合があります。

  • ストレージへの影響: 豊富なデータには追加のストレージ領域が必要です。

  • 言語の制限: 多言語オプションが必要な言語をサポートしているかどうかを確認します。

サーバーレスの自動セマンティックエンリッチメントには、次の言語オプションがあります。

英語のみのオプション
  • 英語コンテンツ用に最適化

  • 主に英語のテキストを扱うアプリケーションに最適

多言語オプション
  • 次の言語をサポートします: アラビア語、ベンガル語、中国語、英語、フィンランド語、フランス語、ヒンディー語、インドネシア語、日本語、韓国語、ペルシャ語、ロシア語、スペイン語、スワヒリ語、テルグ語

  • 多様で国際的なコンテンツや多言語アプリケーションに最適です

自動セマンティックエンリッチメントのアクセス許可の設定

自動セマンティックエンリッチメントインデックスを作成する前に、必要なアクセス許可を設定する必要があります。このセクションでは、必要なアクセス許可とその設定方法について説明します。

IAM ポリシーのアクセス許可

次の AWS Identity and Access Management (IAM) ポリシーを使用して、自動セマンティックエンリッチメントを操作するために必要なアクセス許可を付与します。

JSON
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AutomaticSemanticEnrichmentPermissions", "Effect": "Allow", "Action": [ "aoss:CreateIndex", "aoss:GetIndex", "aoss:UpdateIndex", "aoss:DeleteIndex", "aoss:APIAccessAll" ], "Resource": "*" } ] }
キー許可
  • アクセスaoss:*Index許可はインデックス管理を有効にします

  • アクセスaoss:APIAccessAll許可は OpenSearch API オペレーションを許可します

  • アクセス許可を特定のコレクションに制限するには、 をコレクションの ARN "Resource": "*"に置き換えます。

データアクセス許可を設定する

自動セマンティックエンリッチメントのインデックスを設定するには、インデックス、パイプライン、モデルコレクションリソースへのアクセス許可を付与する適切なデータアクセスポリシーが必要です。データアクセスポリシーの詳細については、「」を参照してくださいAmazon OpenSearch Serverless のデータアクセスコントロール。データアクセスポリシーを設定する手順については、「」を参照してくださいデータアクセスポリシーの作成 (コンソール)

データアクセス許可

[ { "Description": "Create index permission", "Rules": [ { "ResourceType": "index", "Resource": ["index/collection_name/*"], "Permission": [ "aoss:CreateIndex", "aoss:DescribeIndex", "aoss:UpdateIndex", "aoss:DeleteIndex" ] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, { "Description": "Create pipeline permission", "Rules": [ { "ResourceType": "collection", "Resource": ["collection/collection_name"], "Permission": [ "aoss:CreateCollectionItems", "aoss:DescribeCollectionItems" ] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, { "Description": "Create model permission", "Rules": [ { "ResourceType": "model", "Resource": ["model/collection_name/*"], "Permission": ["aoss:CreateMLResources"] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, ]

ネットワークアクセス許可

サービス APIsプライベートコレクションにアクセスできるようにするには、サービス API とコレクション間の必要なアクセスを許可するネットワークポリシーを設定する必要があります。ネットワークポリシーの詳細については、「Amazon OpenSearch Serverless のネットワークアクセス」を参照してください。

[ { "Description":"Enable automatic semantic enrichment in a private collection", "Rules":[ { "ResourceType":"collection", "Resource":[ "collection/collection_name" ] } ], "AllowFromPublic":false, "SourceServices":[ "aoss.amazonaws.com" ], } ]
プライベートコレクションのネットワークアクセス許可を設定するには
  1. https://console.aws.amazon.com/aos/home で OpenSearch Service コンソールにサインインします。

  2. 左側のナビゲーションで、ネットワークポリシーを選択します。次に、以下のいずれかを行ってください。

    • 既存のポリシー名を選択し、編集を選択します

    • ネットワークポリシーの作成を選択し、ポリシーの詳細を設定します。

  3. アクセスタイプエリアで、プライベート (推奨) を選択し、AWS サービスプライベートアクセスを選択します。

  4. 検索フィールドで、サービスを選択し、aoss.amazonaws.com を選択します。

  5. リソースタイプエリアで、OpenSearch エンドポイントへのアクセスを有効にするボックスを選択します。

  6. 検索コレクション (複数可) または入力特定のプレフィックス用語 (複数可) では、検索フィールドにコレクション名を選択します。次に、ネットワークポリシーに関連付けるコレクションの名前を入力または選択します。

  7. 新しいネットワークポリシーの場合は作成、既存のネットワークポリシーの場合は更新を選択します。