Ajuste de la capacidad - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ajuste de la capacidad

Amazon Kendraproporciona recursos para su índice enunidades de capacidad. Cada unidad de capacidad proporciona recursos adicionales para su índice. Hay unidades de capacidad independientes para almacenamiento de documentos y consultas. Solo puedes añadir unidades de capacidad aAmazon KendraÍndices Enterprise Edition. No puedes añadir capacidad a un índice Developer Edition.

Una unidad de capacidad de almacenamiento de documentos proporciona el siguiente almacenamiento adicional para su índice.

  • 100.000 documentos o 30 GB de almacenamiento.

Una unidad de capacidad de consulta proporciona las siguientes consultas adicionales para el índice.

  • 0,1 consultas por segundo o aproximadamente 8.000 consultas por día.

Cada índice viene con una capacidad base igual a 1 unidad de capacidad. Existe un costo adicional por cada unidad de capacidad adicional. Consulte Precios de Amazon Kendra para obtener más información.

Puede añadir hasta 100 unidades de capacidad adicional a sus recursos de almacenamiento de y consultas. Si necesitas más de 100 unidades adicionales,contactoAWSCompatibilidad con.

Puede ajustar las unidades de capacidad hasta 5 veces al día para que se ajusten a sus requisitos de uso. No puede reducir la capacidad de almacenamiento de documentos por debajo del número de documentos almacenados en el índice. Por ejemplo, si va a almacenar 150 000 documentos, no puede reducir la capacidad de almacenamiento por debajo de 1 unidad adicional.

Puede ver los recursos que utiliza un índice en la consola seleccionando el nombre del índice para abrir la configuración del índice y otra información, o bien puede utilizar elDescribeIndexAPI.Amazon Kendratambién devuelve excepciones cuando supera la capacidad de un índice. Obtienes unServiceQuotaExceededExceptioncuando el tamaño total extraído de todos los documentos supera el límite de un índice. Obtienes unInvalidRequestpara cada documento cuando el número de documentos supera el límite de un índice. Obtienes unThrottlingExceptioncuando el número de consultas por segundo supera el límite. Para obtener más información sobre los límites, consulteCuotas paraAmazon Kendra.

Capacidad de visualización

Ver los recursos que utiliza el índice con elAmazon Kendraconsola seleccionando el nombre del índice para acceder a los detalles. La consola también proporciona gráficos de uso para que pueda determinar cuánta capacidad de almacenamiento y consulta utiliza el índice. Puede utilizar esta información para ayudarlo a planificar cuándo debe agregar capacidad adicional.

Para ver el almacenamiento de documentos y el uso de consultas (consola)

  1. Inicie sesión en elAWS Management Consoley abraAmazon KendraConsola dehttps://console.aws.amazon.com/kendra/home.

  2. En la lista de índices, elige el índice al que quieres acceder.

  3. Desplázate hasta la sección de configuración para ver el almacenamiento total de documentos y la capacidad de consulta actuales.

Para ver la capacidad mediante elAmazon KendraAPI, utiliceCapacityUnitsparámetro enDescribeIndexAPI.

Adición y eliminación de capacidad

Si necesitas capacidad adicional para tu índice, puedes añadirlo mediante la consola o elAmazon KendraAPI.

Para agregar o eliminar almacenamiento o capacidad de consultas (consola)

  1. Inicie sesión en elAWS Management Consoley abraAmazon KendraConsola dehttps://console.aws.amazon.com/kendra/home.

  2. En la lista de índices, elija el índice al que desee acceder.

  3. SelectEditaro seleccioneEditardesde lasActionsDropdown.

  4. SelectPróximoPara ir a la página de detalles del aprovisionamiento.

  5. Agregar o quitar almacenamiento de documentos y/o unidades de capacidad de consulta.

  6. Siga seleccionandoPróximopara ir a la página de revisión y, a continuación, seleccionarActualizaciónPara guardar los cambios.

Después de actualizar la capacidad del índice, pueden pasar varios minutos hasta que los cambios surtan efecto.

Para agregar o eliminar capacidad medianteAmazon KendraAPI, utiliceCapacityUnitsparámetro enUpdateIndexAPI.

Capacidad de sugerencias de consultas

Cuando se utilizasugerencias de consultas, hay una capacidad de consulta básica de 2,5Obtener sugerencias de consultasllamadas por segundo. LaGetQuerySuggestionscapacidad es cinco veces la capacidad de consulta aprovisionada para un índice o la capacidad base de 2,5 llamadas por segundo, lo que sea superior. Por ejemplo, la capacidad base de un índice es de 0,1 consultas por segundo yGetQuerySuggestionscapacidad tiene una base de 2,5 llamadas por segundo. Si agrega otras 0,1 consultas por segundo para un total de 0,2 consultas por segundo para un índice, elGetQuerySuggestionsla capacidad es de 2,5 llamadas por segundo (más de cinco veces 0,2 consultas por segundo).

Amazon Kendracapacidad de experiencia

Capacidad de experiencia de búsqueda

Amazon KendraEmpieza a acelerarseQuery,QuerySuggestions,SubmitFeedbackpara suAmazon Kendraexperiencia a 15 solicitudes por segundo y 40 solicitudes por segundo para fragmentación de consultas. Para un índice con más de 150 unidades de capacidad de consulta, estos límites siguen aplicándose.

Por ejemplo, las unidades de capacidad de consulta del índice son 150, por lo que la aplicación de experiencia de búsqueda puede gestionar 15 solicitudes por segundo. Sin embargo, si ha escalado a 200 unidades de capacidad de consulta, la aplicación de experiencia de búsqueda seguirá gestionando solo 15 solicitudes por segundo. Si limitas el índice a 100 unidades de capacidad de consulta, la aplicación de experiencia de búsqueda solo gestionará 10 solicitudes por segundo.

Ráfaga de consultas adaptativas

Amazon Kendratiene una capacidad base aprovisionada de 1 unidad de capacidad de consulta. Puede utilizar hasta 8.000 consultas al día con un rendimiento mínimo de 0,1 consultas por segundo (por unidad de capacidad de consulta). Las consultas acumuladas durarán hasta 24 horas y pueden acomodar ráfagas de tráfico. La cantidad de ráfaga permitida varía porque depende de la carga del clúster en un momento dado. Aprovisione suficientes unidades de capacidad de consulta para gestionar los niveles de carga máximos.

Un enfoque adaptativo para gestionar ráfagas de tráfico inesperadas más allá del rendimiento aprovisionado esAmazon Kendraestá integradoráfaga de consultas adaptativas. La fragmentación de consultas adaptativa está disponible en Enterprise Edition deAmazon Kendra.

La fragmentación de consultas adaptativa es una capacidad integrada que le permite aplicar capacidad de consulta no utilizada para gestionar el tráfico inesperado.Amazon Kendraacumula las consultas no utilizadas a la velocidad de consultas aprovisionadas por segundo, cada segundo, hasta el número máximo de consultas que has aprovisionado para tuAmazon Kendraíndice. Estas consultas acumuladas se utilizan para tráfico inesperado por encima de la capacidad asignada. El rendimiento óptimo de la fragmentación de consultas adaptativas puede variar en función de varios factores, como el tamaño total del índice, la complejidad de las consultas, las consultas no utilizadas acumuladas y la carga general del índice. Se recomienda que realice sus propias pruebas de carga para medir con precisión la capacidad de estallido.