검색 분석을 통한 인사이트 확보 - Amazon Kendra

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

검색 분석을 통한 인사이트 확보

Amazon Kendra 검색 분석을 사용하여 검색 애플리케이션이 사용자가 정보를 찾도록 지원하는 데 성공했는지 또는 실패했는지에 대한 통찰력을 얻을 수 있습니다.

Amazon Kendra 애널리틱스는 사용자가 검색 애플리케이션과 상호 작용하는 방식과 검색 애플리케이션 구성이 얼마나 효과적인지에 대한 스냅샷을 제공합니다. GetSnapshotsAPI를 사용하거나 콘솔의 탐색 패널에서 분석을 선택하여 지표 데이터를 볼 수 있습니다.

GetSnapshots에서 생성된 데이터를 사용자 지정 대시보드에서 렌더링할 수 있습니다. 또는 콘솔에 제공된 지표 대시보드(시각적 그래프 포함)를 사용할 수도 있습니다. 시각적 대시보드를 사용하면 시간 경과에 따른 사용자 행동의 추세나 패턴을 찾아보거나 검색 애플리케이션 구성의 문제를 찾아낼 수 있습니다. 예를 들어 일일 쿼리 수가 일정하고 꾸준히 증가하는 선 그래프는 채택률과 사용량이 증가했음을 의미할 수 있습니다. 반면, 급격한 하락은 조사해야 할 문제가 있음을 의미할 수 있습니다.

지표를 사용하여 서로 다른 데이터 지점을 연결하면 사용자가 정보를 쿼리하는 방식과 관련된 문제를 해결하거나 비즈니스 기회를 발견할 수 있습니다. 예를 들어 'AI는 어떻게 작동합니까?'라는 문서는 검색 결과에서 가장 많이 클릭된 문서이며, 가장 많이 검색된 쿼리는 '기계 학습은 어떻게 작동합니까?'입니다. 이를 통해 사용자가 선호하는 용어와 언어를 알 수 있습니다. 이러한 용어를 문서에 통합하거나 이러한 용어에 대한 사용자 지정 동의어를 사용하면 사용자가 문서를 더 쉽게 검색할 수 있도록 할 수 있습니다.

검색 지표

검색 애플리케이션의 성능이나 사용자가 검색하는 정보를 분석하기 위한 10가지 지표가 있습니다. 지표 데이터를 검색하려면 GetSnapshots 호출 시 검색하려는 지표 데이터의 문자열 이름을 지정합니다.

또한 지표 데이터를 보려면 시간 간격이나 기간을 제공해야 합니다. 시간 간격은 색인의 시간대를 사용합니다. 다음 시간 창에서 데이터를 볼 수 있습니다.

  • THIS_WEEK: 일요일에 시작하여 현재 날짜의 전날에 끝나는 이번 주.

  • ONE_WEEK_AGO: 이전 주, 일요일에 시작하여 다음 토요일에 끝납니다.

  • TWO_WEEKS_AGO: 이전 주의 전 주, 일요일에 시작하여 다음 토요일에 끝납니다.

  • THIS_MONTH: 이번 달, 그 달의 첫째 날에 시작하여 현재 날짜 전날에 끝납니다.

  • ONE_MONTH_AGO: 이전 달, 그 달의 첫째 날에 시작하여 마지막 날에 끝납니다.

  • TWO_MONTHS_AGO: 이전 달의 전 달, 그 달의 첫째 날에 시작하여 마지막 날에 끝납니다.

콘솔에서 지원되는 기간은 이번 주, 이전 주, 이번 달, 이전 달입니다.

클릭률

검색 결과에서 문서로 클릭을 유도한 쿼리의 비율입니다. 이를 통해 검색 애플리케이션 구성이 사용자가 쿼리와 관련된 정보를 찾는 데 도움이 되는지 파악할 수 있습니다. 즉각적인 답변을 반환하는 쿼리의 경우 사용자는 문서를 클릭하여 자세한 내용을 확인할 필요가 없을 수도 있습니다. 자세한 설명은 즉각적인 응답률 섹션을 참조하세요. 클릭스루 피드백이 수집되도록 SubmitFeedback하려면 전화를 걸어야 합니다.

GetSnapshots API를 사용하여 클릭률에 대한 데이터를 검색하려면 metricTypeAGG_QUERY_DOC_METRICS로 지정합니다. 탐색 패널에서 분석을 선택하여 콘솔에서 이 지표를 볼 수도 있습니다.

제로 클릭률

검색 결과에서 클릭으로 이어지지 않은 쿼리의 비율입니다. 이를 통해 관련 없는 검색 결과를 제공하는 콘텐츠 격차를 파악할 수 있습니다. 즉각적인 답변을 반환하는 쿼리의 경우 사용자는 문서를 클릭하여 자세한 내용을 확인할 필요가 없을 수도 있습니다. 자세한 설명은 즉각적인 응답률 섹션을 참조하세요. 또한 조정 구성과 같은 검색 설정이 검색 결과에 문서가 반환되는 방식에 영향을 미칠 수 있습니다.

GetSnapshots API를 사용하여 제로 클릭률에 대한 데이터를 검색하려면 metricTypeAGG_QUERY_DOC_METRICS로 지정합니다. 탐색 패널에서 분석을 선택하여 콘솔에서 이 지표를 볼 수도 있습니다.

제로 검색 결과 비율

검색 결과가 없는 쿼리의 비율입니다. 이를 통해 관련된 검색 결과가 없는 콘텐츠 격차를 파악할 수 있습니다.

GetSnapshots API를 사용하여 제로 검색 결과 비율에 대한 데이터를 검색하려면 metricTypeAGG_QUERY_DOC_METRICS로 지정합니다. 탐색 패널에서 분석을 선택하여 콘솔에서 이 지표를 볼 수도 있습니다.

즉각적인 응답률

즉각적인 답변 또는 FAQ가 반환된 쿼리의 비율입니다. 이를 통해 정보 제공에서 즉각적 답변이 어떤 역할을 하는지 이해할 수 있습니다.

GetSnapshots API를 사용하여 즉각적인 응답률에 대한 데이터를 검색하려면 metricTypeAGG_QUERY_DOC_METRICS로 지정합니다. 탐색 패널에서 분석을 선택하여 콘솔에서 이 지표를 볼 수도 있습니다.

상위 쿼리

사용자가 검색한 상위 100개 쿼리. 이를 통해 인기 있는 검색어와 사용자가 가장 관심을 갖는 정보의 종류를 파악할 수 있습니다.

지표에는 쿼리 검색 횟수, 문서에 대한 클릭률, 문서로 클릭되지 않은 건의 비율, 쿼리 검색 결과의 평균 클릭 깊이, 쿼리에 대한 즉각적인 답변 비율, 쿼리의 처음 10개 검색 결과에 대한 평균 신뢰도 등이 포함됩니다.

GetSnapshots API를 사용하여 상위 쿼리에 대한 데이터를 검색하려면 metricTypeQUERIES_BY_COUNT로 지정합니다. 콘솔의 탐색 패널에서 분석을 선택한 다음 쿼리 목록에서 상위 쿼리를 선택하면 콘솔에서 이 지표도 볼 수 있습니다.

클릭 없는 상위 쿼리

검색 결과에서 클릭으로 이어지지 않은 상위 100개 쿼리입니다. 이를 통해 일부 검색어와 관련된 문서가 부족하거나 검색 애플리케이션 구성에서 관련 없는 검색 결과가 반환되는 등의 콘텐츠 격차를 파악할 수 있습니다. 즉각적인 답변을 반환하는 쿼리의 경우 사용자는 문서를 클릭하여 자세한 내용을 확인할 필요가 없을 수도 있습니다. 자세한 설명은 즉각적인 응답률 섹션을 참조하세요.

지표에는 쿼리가 클릭으로 이어지지 않은 횟수, 쿼리에 대한 제로 클릭의 비율, 쿼리에 대한 즉각적인 답변 비율, 쿼리의 처음 10개 검색 결과에 대한 평균 신뢰도가 포함됩니다.

GetSnapshots API를 사용하여 클릭 없는 상위 쿼리에 대한 데이터를 검색하려면 metricTypeQUERIES_BY_ZERO_CLICK_RATE로 지정합니다. 콘솔의 탐색 패널에서 분석을 선택한 다음 쿼리 목록에서 상위 제로 클릭 쿼리를 선택하면 콘솔에서 이 지표도 볼 수 있습니다.

검색 결과가 없는 상위 쿼리

검색 결과가 없는 상위 100개 쿼리입니다. 이를 통해 일부 쿼리와 관련된 문서가 없는 콘텐츠의 격차를 파악할 수 있습니다. 또는 사용자가 특수 용어로 쿼리하여 검색 결과가 나오지 않을 수 있으며, 이를 처리하기 위해 사용자 지정 동의어를 만들라는 메시지가 표시될 수 있습니다.

지표에는 쿼리의 검색 결과가 없었던 횟수, 검색 결과가 없는 쿼리의 비율, 모든 쿼리 수와 비교한 쿼리 검색 횟수의 비율 등이 포함됩니다.

GetSnapshots API를 사용하여 검색 결과가 없는 상위 쿼리에 대한 데이터를 검색하려면 metricTypeQUERIES_BY_ZERO_RESULT_RATE로 지정합니다. 콘솔의 탐색 패널에서 분석을 선택한 다음 쿼리 목록에서 상위 제로 결과 쿼리를 선택하면 콘솔에서 이 지표도 볼 수 있습니다.

가장 많이 클릭된 문서

검색 결과에서 가장 많이 클릭된 상위 100개 문서입니다. 이를 통해 사용자가 정보를 쿼리할 때 가장 관련성이 높은 문서 또는 검색 결과를 파악할 수 있습니다.

지표에는 문서를 클릭한 횟수, 문서가 사용자로부터 받은 좋아요 수(엄지 손가락 위로), 문서가 사용자로부터 받은 싫어요 수(엄지 손가락 아래로)가 포함됩니다.

GetSnapshots API를 사용하여 가장 많이 클릭된 문서에 대한 데이터를 검색하려면 metricTypeDOCS_BY_CLICK_COUNT로 지정합니다. 콘솔의 탐색 패널에서 분석을 선택한 다음 쿼리 목록에서 가장 많이 클릭된 문서를 선택하면 콘솔에서 이 지표도 볼 수 있습니다.

총 쿼리 수

사용자가 검색한 총 쿼리 수입니다. 이를 통해 사용자가 검색 애플리케이션에 얼마나 참여하고 있는지 파악할 수 있습니다.

GetSnapshots API를 사용하여 총 쿼리 수에 대한 데이터를 검색하려면 metricTypeAGG_QUERY_DOC_METRICS로 지정합니다. 탐색 패널에서 분석을 선택하여 콘솔에서 이 지표를 볼 수도 있습니다.

총 문서

인덱스의 총 문서 수입니다. 이를 통해 인덱스 크기를 총 쿼리 수와 비교하여 쿼리 볼륨에 적합한 문서 수가 있는지 확인할 수 있습니다.

GetSnapshots API를 사용하여 총 문서 수에 대한 데이터를 검색하려면 metricTypeAGG_QUERY_DOC_METRICS로 지정합니다. 탐색 패널에서 분석을 선택하여 콘솔에서 이 지표를 볼 수도 있습니다.

지표 데이터 검색 예제

다음 코드는 지난 달의 상위 쿼리에 대한 데이터를 검색하는 예제입니다.

Console
지난 달의 상위 쿼리를 검색하려면
  1. 왼쪽 탐색 창의 인덱스에서 인덱스를 선택한 다음 분석을 선택합니다.

  2. 분석 페이지에서 이번 주 버튼을 선택하여 데이터 검색 기간을 지난 달로 변경합니다.

  3. 분석 페이지의 쿼리 목록에서 상위 쿼리를 선택합니다.

CLI

지난 달의 상위 쿼리를 검색하려면

aws kendra get-snapshots \ --index-id index-id \ --interval "ONE_MONTH_AGO" \ --metric-type "QUERIES_BY_COUNT"
Python

지난 달의 상위 쿼리를 검색하려면

import boto3 kendra = boto3.client("kendra") index_id = "index-id" interval = "ONE_MONTH_AGO" metric_type = "QUERIES_BY_COUNT" snapshots_response = kendra.get_snapshots( IndexId = index_id, Interval = interval, MetricType = metric_type ) print("Top queries data: " + snapshots_response["snapshotsData"])
Java

지난 달의 상위 쿼리를 검색하려면

package com.amazonaws.kendra; import software.amazon.awssdk.services.kendra.KendraClient; import software.amazon.awssdk.services.kendra.model.GetSnapshotsRequest; import software.amazon.awssdk.services.kendra.model.GetSnapshotsResponse; public class TopQueriesExample { public static void main(String[] args) { KendraClient kendra = KendraClient.builder().build(); String indexId = "indexID"; String interval = "ONE_MONTH_AGO"; String metricType = "QUERIES_BY_COUNT"; GetSnapshotsRequest getSnapshotsRequest = GetSnapshotsRequest .builder() .indexId(indexId) .interval(interval) .metricType(metricType) .build(); GetSnapshotsResponse getSnapshotsResponse = kendra.getSnapshots(GetSnapshotsRequest); System.out.println(String.format("Top queries data: ", getSnapshotsResponse.snapshotsData()))

지표에서 실행 가능한 인사이트로

실행 가능한 인사이트는 원시 데이터에서 추출한 의미 있는 정보로, 행동이나 결정을 안내하는 지침으로 사용됩니다. 지표에서 의미를 추출하고 이를 사용하여 실행 가능한 인사이트를 이끌어내려면 지표를 분리해서 보는 것뿐만 아니라 여러 지표를 연결하여 보는 것도 중요합니다.

예를 들어 클릭 없는 상위 쿼리는 '현재 사용 가능한 지역은 어디입니까?'입니다. 하지만 즉각적인 응답률도 100퍼센트입니다. 따라서 사용자는 검색 결과나 사용 가능한 리전에 대한 정보를 제공하는 문서를 클릭하지 않고도 이 질문에 대한 답을 얻을 수 있습니다. 제로 클릭만 고려하면 전체 스토리를 이해할 수 없으며 검색 애플리케이션 구성이 이 쿼리를 성공적으로 처리했는지에 대해 잘못된 결론을 내릴 수 있습니다.

실행 가능한 인사이트의 또 한 가지 예시는 비즈니스 기회를 발견하는 것입니다. 기업은 종종 검색 지표를 분석하여 고객을 유치할 기회를 찾습니다. 가장 많이 클릭된 문서는 '사용 가능한 지역'입니다. 이 외에도 가장 많이 검색된 쿼리 대부분은 오세아니아 지역의 제품 가용성에 대한 질문과 관련이 있습니다. 100%의 즉각적인 응답률과 함께, 답변의 일부로 사용 가능한 리전에 대한 추가 정보가 높은 클릭률을 기록했습니다. 이는 해당 리전에서 귀사의 제품 또는 서비스에 대한 관심과 수요가 있음을 시사합니다.

검색 분석 시각화 및 보고

시간 경과에 따른 추세나 패턴을 시각화하고 살펴볼 수 있는 트렌드 데이터가 포함된 다섯 가지 지표가 있습니다. 콘솔을 사용하는 경우 트렌드 데이터의 그래프가 제공됩니다. API를 사용하는 경우 트렌드 데이터를 검색하여 자체 그래프나 시각화를 만들 수 있습니다. 콘솔에 있는 대부분의 그래프는 선택한 기간 동안의 일일 데이터 포인트를 표시합니다.

콘솔은 보고 싶은 그래프와 상위 목록을 선택할 수 있는 지표 대시보드를 제공합니다. 분석 홈 페이지에서 내보내기를 선택하면 대시보드에 표시된 지표를 CSV 형식으로 내보낼 수 있습니다. 비즈니스 문서나 프레젠테이션에 이러한 보고서를 포함할 수 있습니다.

다음 지표를 볼 수 있습니다.

총 쿼리 그래프

하루에 실행된 쿼리 수를 나타내는 선 그래프입니다. 그래프를 통해 일일 사용자 참여 패턴을 시각화할 수 있습니다. 몇 가지 예로는 사용자 참여가 꾸준히 증가 또는 감소하거나, 검색 애플리케이션의 다운 또는 웹사이트 관련 문제로 인해 쿼리가 0으로 급감하는 경우를 들 수 있습니다.

API를 사용하는 경우 TREND_QUERY_DOC_METRICS 지정을 통해 이러한 데이터를 검색할 수 있습니다. 데이터를 사용하여 그래프를 직접 만들거나 콘솔에 제공된 그래프를 사용할 수 있습니다.

클릭률 그래프

일일 클릭률의 비율을 나타낸 선 그래프입니다. 그래프를 통해 일일 클릭률의 패턴을 시각화할 수 있습니다. 클릭률의 꾸준한 증가 또는 감소, 클릭률 증가에 영향을 미칠 수 있는 즉각적인 답변의 감소 등을 예로 들 수 있습니다.

API를 사용하는 경우 TREND_QUERY_DOC_METRICS 지정을 통해 이러한 데이터를 검색할 수 있습니다. 데이터를 사용하여 그래프를 직접 만들거나 콘솔에 제공된 그래프를 사용할 수 있습니다.

제로 클릭률 그래프

일일 제로 클릭의 비율을 나타낸 선 그래프입니다. 그래프를 통해 일일 제로 클릭률의 패턴을 시각화할 수 있습니다. 제로 클릭률의 꾸준한 증가 또는 감소, 제로 클릭 증가에 영향을 미칠 수 있는 즉각적인 답변의 증가 등을 예로 들 수 있습니다.

API를 사용하는 경우 TREND_QUERY_DOC_METRICS 지정을 통해 이러한 데이터를 검색할 수 있습니다. 데이터를 사용하여 그래프를 직접 만들거나 콘솔에 제공된 그래프를 사용할 수 있습니다.

제로 검색 결과 비율 그래프

일일 제로 검색 결과의 비율을 나타낸 선 그래프입니다. 그래프를 통해 일일 제로 검색 결과 비율의 패턴을 시각화할 수 있습니다. 검색 결과가 없는 비율이 꾸준히 증가하거나 감소하는 경우, 검색 결과 제로의 증가에 영향을 미칠 수 있는 인덱스의 문서 수 급감 등을 예로 들 수 있습니다.

API를 사용하는 경우 TREND_QUERY_DOC_METRICS 지정을 통해 이러한 데이터를 검색할 수 있습니다. 데이터를 사용하여 그래프를 직접 만들거나 콘솔에 제공된 그래프를 사용할 수 있습니다.

즉각적인 응답률 그래프

즉각적인 답변 또는 FAQ가 반환된 쿼리의 비율을 나타낸 선 그래프입니다. 그래프를 통해 일일 즉각적인 응답률의 패턴을 시각화할 수 있습니다. 몇 가지 예로는 질문-답변 유형 쿼리의 꾸준한 증가 또는 감소, 즉각적인 답변 증가에 영향을 미칠 수 있는 클릭률 감소 등이 있습니다.

API를 사용하는 경우 TREND_QUERY_DOC_METRICS 지정을 통해 이러한 데이터를 검색할 수 있습니다. 데이터를 사용하여 그래프를 직접 만들거나 콘솔에 제공된 그래프를 사용할 수 있습니다.