Determinación de los requisitos de capacidad - Amazon Athena

Determinación de los requisitos de capacidad

Antes de crear una reserva de capacidad, puede calcular la capacidad necesaria para poder asignarle el número correcto de DPU. Y, una vez utilizada una reserva, es posible que desee comprobar si la capacidad de la reserva es insuficiente o excesiva. En este tema se describen las técnicas que puede utilizar para realizar estos cálculos y también se describen algunas herramientas de AWS para evaluar el uso y el costo.

Cálculo de la capacidad requerida

Al calcular los requisitos de capacidad, es útil tener en cuenta dos perspectivas: cuánta capacidad podría requerir una consulta en particular y cuánta capacidad podría necesitar en general.

Cálculo de los requisitos de capacidad por consulta

Para determinar la cantidad de DPU que podría necesitar una consulta, puede utilizar las siguientes pautas:

  • Las consultas DDL consumen 4 DPU.

  • Las consultas DML consumen entre 4 y 124 DPU.

Athena determina el número de DPU que necesita una consulta DML cuando esta se envía. El número varía según el tamaño de los datos, el formato de almacenamiento, la construcción de la consulta y otros factores. Por lo general, Athena intenta seleccionar el número de DPU más bajo y eficiente. Si Athena determina que se necesita más potencia computacional para que la consulta se complete correctamente, aumentará el número de DPU asignadas a la consulta.

Cálculo de los requisitos de capacidad específicos de la carga de trabajo

Para determinar la capacidad que podría necesitar para ejecutar varias consultas al mismo tiempo, tenga en cuenta las pautas generales de la siguiente tabla:

Consultas simultáneas DPU requeridas
10 40 o más
20 96 o más
30 o más 240 o más

Tenga en cuenta que la cantidad real de DPU que necesita depende de sus objetivos y patrones de análisis. Por ejemplo, si desea que las consultas comiencen inmediatamente sin colas, determine su demanda máxima de consultas simultáneas y, a continuación, aprovisione la cantidad de DPU en consecuencia.

Puede aprovisionar menos DPU que la demanda máxima, pero es posible que las consultas se pongan en cola cuando se produzca la demanda máxima. Cuando las consultas se ponen en cola, Athena mantiene las consultas en una cola y las ejecuta cuando hay capacidad disponible.

Si su objetivo es ejecutar las consultas dentro de un presupuesto fijo, puede utilizar la AWScalculadora de precios para determinar la cantidad de DPU necesarias.

Por último, recuerde que el tamaño de los datos, el formato de almacenamiento y la forma en que se escribe una consulta influyen en las DPU que requiere una consulta. Para aumentar el rendimiento de las consultas, puede comprimir o particionar los datos o convertirlos en formatos de columnas. Para obtener más información, consulte Ajuste del rendimiento en Athena.

Señales de que se necesita más capacidad

Los mensajes de error de capacidad insuficiente y la cola de consultas son dos indicios de que la capacidad asignada es inadecuada.

Si las consultas fallan y aparece un mensaje de error de capacidad insuficiente, es probable que el recuento de DPU de la reserva de capacidad sea demasiado bajo para la carga de trabajo de la consulta. Por ejemplo, si tiene una reserva con 24 DPU y ejecuta una consulta que requiere más de 24 DPU, la consulta fallará. Para controlar este error de consulta, puede utilizar Eventos de EventBridge de Athena. Intente agregar más DPU y vuelva a ejecutar la consulta.

Si hay muchas consultas en cola, significa que otras consultas utilizan al máximo su capacidad. Para reducir las colas, realice una de las siguientes acciones:

  • Agregue las DPU a su reserva para aumentar la simultaneidad de consultas.

  • Elimine los grupos de trabajo de su reserva para liberar capacidad para otras consultas.

Para comprobar si hay demasiadas colas de consultas, utilice la métrica de CloudWatch de tiempo de cola de consultas de Athena para los grupos de trabajo de su reserva de capacidad. Si el valor supera el umbral preferido, puede agregar las DPU a la reserva de capacidad.

Comprobación de la capacidad inactiva

Para comprobar la capacidad inactiva, puede reducir el número de DPU de la reserva o aumentar su carga de trabajo y, a continuación, observar los resultados.

Para comprobar la capacidad inactiva
  1. Realice una de las acciones siguientes:

    • Reduzca la cantidad de DPU de su reserva (reduzca los recursos disponibles).

    • Agregue grupos de trabajo a su reserva (aumente la carga de trabajo).

  2. Utilice CloudWatch para medir el tiempo de espera de las consultas.

  3. Si el tiempo de espera aumenta más allá del nivel deseado, realice una de las siguientes acciones.

    • Elimine los grupos de trabajo.

    • Agregue las DPU a su reserva de capacidad.

  4. Después de cada cambio, compruebe el rendimiento y el tiempo de espera de las consultas.

  5. Siga ajustando la carga de trabajo o el recuento de DPU para lograr el equilibrio deseado.

Si no desea mantener la capacidad fuera del periodo de tiempo preferido, puede cancelar la reserva y crear otra más adelante. Sin embargo, aunque haya cancelado recientemente la capacidad de otra reserva, las solicitudes de capacidad nueva no están garantizadas y la creación de reservas nuevas lleva tiempo.

Herramientas para evaluar los requisitos de capacidad y el costo

Puede utilizar los siguientes servicios y características en AWS para medir el uso y los costos de Athena.

Métricas de CloudWatch

Puede configurar Athena para que publique métricas relacionadas con consultas en Amazon CloudWatch a nivel de grupo de trabajo. Después de habilitar las métricas para el grupo de trabajo, las métricas de las consultas del grupo de trabajo se muestran en la consola de Athena, en la página de detalles del grupo de trabajo.

Para obtener información sobre las métricas de Athena que se publican en CloudWatch y sus dimensiones, consulte Supervisión de las consultas de Athena con métricas de CloudWatch.

Métricas de uso de CloudWatch

Puede usar las métricas de uso de CloudWatch para proporcionar visibilidad de cómo su cuenta usa los recursos mostrando el uso actual del servicio en los gráficos y paneles de CloudWatch. En Athena, las métricas de disponibilidad de uso corresponden a las cuotas de servicio de AWS para Athena. Puede configurar alarmas que le avisen cuando su uso se acerque a una Service Quota.

Para obtener más información, consulte Supervisión de las métricas de uso de Athena.

Eventos de Amazon EventBridge

Puede utilizar Amazon Athena con Amazon EventBridge para recibir notificaciones en tiempo real sobre el estado de las consultas. Cuando una consulta ha enviado estados de transiciones, Athena publica un evento en EventBridge que contiene información sobre la transición de estado de consulta. Puede escribir reglas simples para eventos que le interesen y realizar acciones automatizadas cuando un evento coincida con una regla.

Para obtener más información, consulte los recursos siguientes.

Etiquetas

En Athena, las reservas de capacidad admiten etiquetas. Una etiqueta consta de una clave y un valor. Para realizar un seguimiento de los costos en Athena, puede utilizar etiquetas de asignación de costos generadas por AWS. AWS utiliza las etiquetas de asignación de costos para organizar los costos de los recursos en el informe de costos y uso. Esto le facilita la categorización y el seguimiento de los costos de AWS. Para activar las etiquetas de asignación de costos para Athena, utilice la consola de AWS Billing and Cost Management.

Para obtener más información, consulte los recursos siguientes.