검색 관련성 조정 - Amazon Kendra

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

검색 관련성 조정

Amazon Kendra 쿼리는 관련성을 기준으로 순위가 매겨진 검색 결과를 생성합니다. 인덱스의 검색 가능한 필드 또는 속성이 모두 이 순위에 영향을 미칩니다.

관련성 조정을 통해 검색 관련성에 대한 필드 또는 속성의 영향을 수정할 수 있습니다. 검색 관련성 조정은 인덱스에 대한 조정 구성을 설정하는 인덱스 수준에서 수동으로 수행하거나 인덱스 수준에서 설정된 구성을 재정의하여 쿼리 수준에서 수행할 수 있습니다.

관련성 조정 기능을 사용하면 쿼리에 필드 또는 속성과 일치하는 용어가 포함되어 있는 경우 응답에서 결과가 부스트됩니다. 또한 일치하는 항목이 있을 때 문서가 받는 부스트 정도를 지정할 수 있습니다. 관련성 Amazon Kendra 조정으로 인해 쿼리 응답에 문서가 포함되는 것은 아니며 문서의 관련성을 결정하는 데 Amazon Kendra 사용되는 요소 중 하나일 뿐입니다.

인덱스의 특정 필드 또는 속성을 높여 특정 응답에 더 높은 중요도를 할당할 수 있습니다. 예를 들어 누군가 “re:Invent는 언제인가요?” 라고 검색하는 경우를 예로 들 수 있습니다. 현장에서 문서 최신성의 관련성을 높일 수 있습니다. _last_update_at 또는 연구 보고서 인덱스에서 '소스' 필드의 특정 데이터 소스를 부스트할 수 있습니다.

포럼 및 기타 지원 지식 기반에서 흔히 볼 수 있는 방법인 투표 또는 조회수를 기반으로 문서를 부스트할 수도 있습니다. 예를 들어 여러 부스트를 조합하여 최근에 본 문서뿐만 아니라 더 많이 본 문서도 부스트할 수 있습니다.

Importance 파라미터를 사용하여 문서가 받는 부스트 양을 설정합니다. Importance 값이 높을수록 필드 또는 속성이 문서의 관련성을 더 높게 부스트합니다. 인덱스를 조정하거나 쿼리 수준에서 조정할 때는 원하는 효과를 얻을 때까지 Importance 파라미터 값을 조금씩 늘리세요. 검색 결과가 개선되고 있는지 확인하려면 검색을 수행하고 결과를 이전 쿼리와 비교하세요.

날짜, 숫자 또는 문자열 속성을 지정하여 인덱스를 조정하거나 쿼리 수준에서 조정할 수 있습니다. StringList 유형의 필드나 속성은 인덱스 수준에서만 조정할 수 있습니다. 각 필드 또는 속성에는 결과를 부스트하는 시기에 대한 특정 기준이 있습니다.

  • 날짜 필드 또는 속성 - 날짜 필드, Duration, Freshness, RankOrder에는 세 가지 특정 기준이 있습니다.

    • Duration는 부스트가 적용되는 기간을 지정합니다. 예를 들어 기간을 86400초(즉, 하루)로 설정하면 하루가 지난 후 부스트 효과가 줄어들기 시작합니다. 중요도가 높을수록 부스트 효과가 더 빨리 감소합니다.

    • Freshness는 필드 또는 속성에 적용될 때 문서의 최신성을 결정합니다. 만든 날짜 또는 마지막 업데이트 날짜 필드에 Freshness를 적용하면 최근에 만든 문서나 마지막으로 업데이트된 문서가 이전 문서보다 “최신” 상태로 간주됩니다. 예를 들어, 문서 1이 11월 14일에 작성되었고 문서 2가 11월 5일에 작성된 경우 문서 1은 문서 2보다 “최신”입니다. 문서 1이 11월 14일에 마지막으로 업데이트되었고 문서 2가 11월 20일에 마지막으로 업데이트되었다면 문서 2가 문서 1보다 “최신”입니다. 문서가 최신 버전일수록 이 부스트가 더 많이 적용됩니다. 인덱스에는 Freshness 필드가 한 개만 있을 수 있습니다.

    • RankOrder는 부스트를 오름차순 또는 내림차순으로 적용합니다. ASCENDING를 지정하는 경우 이후 날짜가 우선합니다. DESCENDING를 지정하는 경우 이전 날짜가 우선합니다.

  • 숫자 필드 또는 속성 - 숫자 필드 또는 속성의 경우 필드 또는 속성의 관련성을 결정할 때 Amazon Kendra 사용해야 하는 순위 순서를 지정할 수 있습니다. ASCENDING를 지정하는 경우 더 높은 숫자가 우선합니다. DESCENDING를 지정하는 경우 더 낮은 숫자가 우선합니다.

  • 문자열 필드 또는 속성 - 문자열 필드 또는 속성의 경우 필드의 범주를 만들어 각 범주에 다르게 적용할 수 있습니다. 예를 들어, “부서”라는 필드 또는 속성을 부스트하면 “HR”의 문서와 “법률”의 문서를 다르게 부스트할 수 있습니다. String 유형의 필드 또는 속성을 부스트할 수 있습니다. 인덱스 수준에서만 StringList 필드를 부스트할 수 있습니다.

인덱스 수준에서의 관련성 조정

콘솔을 사용하여 인덱스 세부 정보에서 조정을 설정하거나 API를 사용하여 인덱스 수준에서 필드 또는 속성의 관련성을 조정합니다. UpdateIndex

다음 예제에서는 _last_updated_at 필드를 문서의 Freshness 필드로 설정합니다.

"DocumentMetadataConfigurationUpdates" : [ { "Name": "_last_updated_at", "Type": "DATE_VALUE", "Relevance": { "Freshness": TRUE, "Importance": 2 } } ]

다음 예제에서는 “부서” 필드의 범주별로 서로 다른 중요도를 적용합니다.

"DocumentMetadataConfigurationUpdates" : [ { "Name": "department", "Type": "STRING_VALUE", "Relevance": { "Importance": 2, "ValueImportanceMap": { "HR": 3, "Legal": 1 } } } ]

쿼리 수준에서의 관련성 조정

Query API를 사용하여 쿼리 수준에서 필드 또는 속성의 관련성을 조정합니다.

콘솔에서는 쿼리 수준의 관련성 조정이 지원되지 않습니다.

쿼리 수준에서 조정하면 각 테스트에 대해 인덱스의 조정 구성을 수동으로 업데이트할 필요가 없으므로 관련성 조정 테스트 프로세스의 속도를 높일 수 있습니다. 쿼리에 조정 구성을 전달하여 문서의 관련성을 조정할 수 있습니다. 그러면 다양한 구성에서 얻은 다양한 결과를 볼 수 있습니다. 쿼리에 전달된 구성은 인덱스 수준에서 설정된 구성을 재정의합니다.

다음 예제는 위 예와 같이 인덱스 수준에서 설정된 “부서” 필드 및 각 부서 범주에 적용되는 중요도를 재정의합니다. 사용자가 검색어를 입력하면 “부서” 필드의 중요도가 상당히 높으며 법무 부서가 HR 부서보다 중요도가 높습니다.

"DocumentRelevanceOverrideConfigurations" : [ { "Name": "department", "Type": "STRING_VALUE", "Relevance": { "Importance": 2, "ValueImportanceMap": { "HR": 2, "Legal": 8 } } } ]