검색 관련성 조정

참고

기능 지원은 인덱스 유형 및 사용 중인 검색 API에 따라 다릅니다. 사용 중인 인덱스 유형 및 검색 API에 대해이 기능이 지원되는지 확인하려면 인덱스 유형을 참조하세요.

Amazon Kendra 쿼리는 관련성에 따라 순위가 매겨진 검색 결과를 생성합니다. 인덱스의 검색 가능한 필드 또는 속성이 모두 이 순위에 영향을 미칩니다.

관련성 조정을 통해 검색 관련성에 대한 필드 또는 속성의 영향을 수정할 수 있습니다. 검색 관련성 조정은 인덱스에 대한 조정 구성을 설정하는 인덱스 수준에서 수동으로 수행하거나 인덱스 수준에서 설정된 구성을 재정의하여 쿼리 수준에서 수행할 수 있습니다.

관련성 조정 기능을 사용하면 쿼리에 필드 또는 속성과 일치하는 용어가 포함되어 있는 경우 응답에서 결과가 부스트됩니다. 또한 일치하는 항목이 있을 때 문서가 받는 부스트 정도를 지정할 수 있습니다. 관련성 튜닝은가 쿼리 응답에 문서를 포함시키지 Amazon Kendra 않고가 문서의 관련성을 결정하는 데 Amazon Kendra 사용하는 요소 중 하나일 뿐입니다.

인덱스의 특정 필드 또는 속성을 높여 특정 응답에 더 높은 중요도를 할당할 수 있습니다. 예를 들어 누군가 “re:Invent는 언제인가요?” 라고 검색하는 경우를 예로 들 수 있습니다. _last_update_at 필드에서 문서 신선도의 관련성을 높일 수 있습니다. 또는 연구 보고서 인덱스에서 '소스' 필드의 특정 데이터 소스를 부스트할 수 있습니다.

포럼 및 기타 지원 지식 기반에서 흔히 볼 수 있는 방법인 투표 또는 조회수를 기반으로 문서를 부스트할 수도 있습니다. 예를 들어 여러 부스트를 조합하여 최근에 본 문서뿐만 아니라 더 많이 본 문서도 부스트할 수 있습니다.

Importance 파라미터를 사용하여 문서가 받는 부스트 양을 설정합니다. Importance 값이 높을수록 필드 또는 속성이 문서의 관련성을 더 높게 부스트합니다. 인덱스를 조정하거나 쿼리 수준에서 조정할 때는 원하는 효과를 얻을 때까지 Importance 파라미터 값을 조금씩 늘리세요. 검색 결과가 개선되고 있는지 확인하려면 검색을 수행하고 결과를 이전 쿼리와 비교하세요.

날짜, 숫자 또는 문자열 속성을 지정하여 인덱스를 조정하거나 쿼리 수준에서 조정할 수 있습니다. StringList 유형의 필드나 속성은 인덱스 수준에서만 조정할 수 있습니다. 각 필드 또는 속성에는 결과를 부스트하는 시기에 대한 특정 기준이 있습니다.

날짜 필드 또는 속성 - 날짜 필드, Duration, Freshness, RankOrder에는 세 가지 특정 기준이 있습니다.
- Duration는 부스트가 적용되는 기간을 지정합니다. 예를 들어 기간을 86400초(즉, 하루)로 설정하면 하루가 지난 후 부스트 효과가 줄어들기 시작합니다. 중요도가 높을수록 부스트 효과가 더 빨리 감소합니다.
- Freshness는 필드 또는 속성에 적용될 때 문서의 최신성을 결정합니다. 만든 날짜 또는 마지막 업데이트 날짜 필드에 Freshness를 적용하면 최근에 만든 문서나 마지막으로 업데이트된 문서가 이전 문서보다 “최신” 상태로 간주됩니다. 예를 들어, 문서 1이 11월 14일에 작성되었고 문서 2가 11월 5일에 작성된 경우 문서 1은 문서 2보다 “최신”입니다. 문서 1이 11월 14일에 마지막으로 업데이트되었고 문서 2가 11월 20일에 마지막으로 업데이트되었다면 문서 2가 문서 1보다 “최신”입니다. 문서가 최신 버전일수록 이 부스트가 더 많이 적용됩니다. 인덱스에는 Freshness 필드가 한 개만 있을 수 있습니다.
- RankOrder는 부스트를 오름차순 또는 내림차순으로 적용합니다. ASCENDING를 지정하는 경우 이후 날짜가 우선합니다. DESCENDING를 지정하는 경우 이전 날짜가 우선합니다.
숫자 필드 또는 속성 - 숫자 필드 또는 속성의 경우 필드 또는 속성의 관련성을 결정할 때에서 사용해야 하는 순위 순서를 지정할 수 Amazon Kendra 있습니다. ASCENDING를 지정하는 경우 더 높은 숫자가 우선합니다. DESCENDING를 지정하는 경우 더 낮은 숫자가 우선합니다.
문자열 필드 또는 속성 - 문자열 필드 또는 속성의 경우 필드의 범주를 만들어 각 범주에 다르게 적용할 수 있습니다. 예를 들어, “부서”라는 필드 또는 속성을 부스트하면 “HR”의 문서와 “법률”의 문서를 다르게 부스트할 수 있습니다. String 유형의 필드 또는 속성을 부스트할 수 있습니다. 인덱스 수준에서만 StringList 필드를 부스트할 수 있습니다.

인덱스 수준에서의 관련성 조정

인덱스 세부 정보에서 조정을 설정하는 콘솔 또는 UpdateIndex API를 사용하여 인덱스 수준에서 필드 또는 속성의 관련성을 조정합니다.

다음 예제에서는 _last_updated_at 필드를 문서의 Freshness 필드로 설정합니다.


"DocumentMetadataConfigurationUpdates" : [
    {
        "Name": "_last_updated_at",
        "Type": "DATE_VALUE",
        "Relevance": {
            "Freshness": TRUE,
            "Importance": 2
        }
    }
]

다음 예제에서는 “부서” 필드의 범주별로 서로 다른 중요도를 적용합니다.


"DocumentMetadataConfigurationUpdates" : [
    {
        "Name": "department",
        "Type": "STRING_VALUE",
        "Relevance": {
            "Importance": 2,
            "ValueImportanceMap": {
                "HR": 3,
                "Legal": 1
            }
        }
    }
]

쿼리 수준에서의 관련성 조정

Query API를 사용하여 쿼리 수준에서 필드 또는 속성의 관련성을 조정합니다.

콘솔에서는 쿼리 수준의 관련성 조정이 지원되지 않습니다.

쿼리 수준에서 조정하면 각 테스트에 대해 인덱스의 조정 구성을 수동으로 업데이트할 필요가 없으므로 관련성 조정 테스트 프로세스의 속도를 높일 수 있습니다. 쿼리에 조정 구성을 전달하여 문서의 관련성을 조정할 수 있습니다. 그러면 다양한 구성에서 얻은 다양한 결과를 볼 수 있습니다. 쿼리에 전달된 구성은 인덱스 수준에서 설정된 구성을 재정의합니다.

다음 예제는 위 예와 같이 인덱스 수준에서 설정된 “부서” 필드 및 각 부서 범주에 적용되는 중요도를 재정의합니다. 사용자가 검색어를 입력하면 “부서” 필드의 중요도가 상당히 높으며 법무 부서가 HR 부서보다 중요도가 높습니다.


"DocumentRelevanceOverrideConfigurations" : [
    {
        "Name": "department",
        "Type": "STRING_VALUE",
        "Relevance": {
            "Importance": 2,
            "ValueImportanceMap": {
                "HR": 2,
                "Legal": 8
            }
        }
    }
]

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

쿼리 결과 축소/확대

검색 분석을 통한 인사이트 확보