Opciones avanzadas - Amazon Athena

Opciones avanzadas

Tamaño de recuperación

El número máximo de resultados (filas) que se devuelven en esta solicitud. Para obtener información sobre el parámetro, consulte GetQuery MaxResults. Para la API de transmisión, el valor máximo es 10 000 000.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
RowsToFetchPerBlock Opcional

1000 en caso de no transmisión

20000 en caso de transmisión

RowsToFetchPerBlock=20000;

Habilitar la reutilización de resultados

Especifica si los resultados de la consulta anterior se pueden reutilizar al ejecutar la consulta. Para obtener información sobre el parámetro, consulte ResultReuseByAgeConfiguration.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
EnableResultReuse Opcional 0 EnableResultReuse=1;

Antigüedad máxima de reutilización de resultados

Especifica, en minutos, la antigüedad máxima de un resultado de consulta anterior que Athena debe tener en cuenta para su reutilización. Para obtener información sobre el parámetro, consulte ResultReuseByAgeConfiguration.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
ReusedResultMaxAgeInMinutes Opcional 60 ReusedResultMaxAgeInMinutes=90;

Habilitar la API de transmisión

Elige si se va a utilizar la API de transmisión de Athena para recuperar el conjunto de resultados.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
UseResultsetStreaming Opcional 0 UseResultsetStreaming=1;

Habilitar recuperación de S3

Recupera el conjunto de resultados generado por Athena desde el bucket de Amazon S3 al interactuar directamente con Amazon S3.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
EnableS3Fetcher Opcional 1 EnableS3Fetcher=1;

Utilizar varios hilos de S3

Recupera datos de Amazon S3 mediante varios hilos. Cuando esta opción está habilitada, el archivo de resultados almacenado en el bucket de Amazon S3 se recupera en paralelo mediante varios hilos.

Habilite esta opción solo si tiene un buen ancho de banda de la red. Por ejemplo, en nuestras mediciones en una instancia c5.2xlarge de EC2, un cliente S3 de un solo hilo alcanzó 1 Gbps, mientras que los clientes S3 de hilos múltiples alcanzaron un rendimiento de red de 4 Gbps.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión

UseMultipleS3Threads

Opcional 0 UseMultipleS3Threads=1;

Utilizar un único catálogo y esquema

De forma predeterminada, el controlador ODBC consulta a Athena para obtener la lista de catálogos y esquemas disponibles. Esta opción obliga al controlador a utilizar el catálogo y el esquema especificados en el cuadro de diálogo de configuración del administrador de orígenes de datos ODBC o en los parámetros de conexión.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
UseSingleCatalogAndSchema Opcional 0 UseSingleCatalogAndSchema=1;

Utilice una consulta para enumerar tablas

Para los tipos de catálogo LAMBDA, permite que el controlador ODBC envíe una consulta SHOW TABLES para obtener una lista de las tablas disponibles. Esta configuración es la predeterminada. Si este parámetro se establece en 0, el controlador ODBC utiliza la API ListTableMetadata de Athena para obtener una lista de las tablas disponibles. Tenga en cuenta que, en el caso de los tipos de catálogos LAMBDA, el uso de ListTableMetadata conduce a una regresión del rendimiento.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
UseQueryToListTables Opcional 1 UseQueryToListTables=1;

Utilice WCHAR para los tipos de cadenas

De forma predeterminada, el controlador ODBC utiliza SQL_CHAR y SQL_VARCHAR para Athena, los tipos de datos de cadena char, varchar, string, array, map<>, struct<> y row. Si se establece este parámetro a 1, se fuerza al controlador a utilizar SQL_WCHAR y SQL_WVARCHAR para los tipos de datos de cadena. Los tipos de caracteres y variables anchos se utilizan para garantizar que los caracteres de diferentes idiomas se puedan almacenar y recuperar correctamente.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
UseWCharForStringTypes Opcional 0 UseWCharForStringTypes=1;

Consultar catálogos externos

Especifica si el controlador necesita consultar catálogos externos desde Athena. Para obtener más información, consulte Migración al controlador ODBC 2.x.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
QueryExternalCatalogs Opcional 0 QueryExternalCatalogs=1;

Verificar SSL

Controla si se deben verificar los certificados SSL cuando se usa el SDK de AWS. Este valor se transfiere al parámetro ClientConfiguration.verifySSL. Para obtener más información, consulte Configuración de cliente de AWS en la Guía para desarrolladores de AWS SDK for C++.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
VerifySSL Opcional 1 VerifySSL=0;

Tamaño del bloque de resultados de S3

Especifica, en bytes, el tamaño del bloque que se va a descargar para una sola solicitud de API GetObject de Amazon S3. El valor predeterminado es 67108864 (64 MB). Los valores mínimo y máximo permitidos son 10485760 (10 MB) y 2146435072 (aproximadamente 2 GB).

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
S3ResultBlockSize Opcional 67108864 S3ResultBlockSize=268435456;

Longitud de columna de cadena

Especifica la longitud de las columnas con el tipo de datos string. Como Athena usa el tipo de datos de cadena Apache Hive, que no tiene una precisión definida, la longitud predeterminada que informa Athena es 2147483647 (INT_MAX). Como las herramientas de inteligencia empresarial suelen preasignar memoria a las columnas, esto puede provocar un consumo elevado de memoria. Para evitarlo, el controlador ODBC de Athena limita la precisión notificada para las columnas del tipo de datos string y expone el parámetro de conexión StringColumnLength para que se pueda cambiar el valor predeterminado.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
StringColumnLength Opcional 255 StringColumnLength=65535;

Longitud de columna de tipo complejo

Especifica la longitud de las columnas con tipos de datos complejos, como map, struct, y array. Al igual que StringColumnLength, Athena informa de una precisión de 0 para las columnas con tipos de datos complejos. El controlador ODBC de Athena establece la precisión predeterminada para las columnas con tipos de datos complejos y expone el parámetro de conexión ComplexTypeColumnLength para que se pueda cambiar el valor predeterminado.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
ComplexTypeColumnLength Opcional 65535 ComplexTypeColumnLength=123456;

Certificado de CA de confianza

Indica al cliente HTTP dónde encontrar el almacén de confianza de certificados SSL. Este valor se transfiere al parámetro ClientConfiguration.caFile. Para obtener más información, consulte Configuración de cliente de AWS en la Guía para desarrolladores de AWS SDK for C++.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
TrustedCerts Opcional %INSTALL_PATH%/bin TrustedCerts=C:\\Program Files\\Amazon Athena ODBC Driver\\bin\\cacert.pem;

Periodo mínimo de sondeo

Especifica el valor mínimo en milisegundos que debe esperarse antes de sondear Athena para determinar el estado de ejecución de la consulta.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
MinQueryExecutionPollingInterval Opcional 100 MinQueryExecutionPollingInterval=200;

Periodo máximo de sondeo

Especifica el valor máximo en milisegundos que se debe esperar antes de sondear Athena para determinar el estado de ejecución de la consulta.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
MaxQueryExecutionPollingInterval Opcional 60000 MaxQueryExecutionPollingInterval=1000;

Multiplicador de sondeo

Especifica el factor para aumentar el periodo de sondeo. De forma predeterminada, el sondeo comienza con el valor del periodo mínimo de sondeo y se duplica con cada sondeo hasta alcanzar el valor del periodo máximo de sondeo.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
QueryExecutionPollingIntervalMultiplier Opcional 2 QueryExecutionPollingIntervalMultiplier=2;

Duración máxima del sondeo

Especifica el valor máximo en milisegundos del tiempo durante el cual un controlador puede sondear Athena para determinar el estado de ejecución de la consulta.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
MaxPollDuration Opcional 1800000 MaxPollDuration=1800000;

Tiempo de espera de la conexión

La cantidad de tiempo (en milisegundos) que la conexión HTTP espera a que se establezca una conexión. Este valor se establece para el cliente de Athena ClientConfiguration.connectTimeoutMs. Si no se especifica, se usa el valor predeterminado de curl. Para obtener más información sobre los parámetros de conexión, consulte Configuración de clientes en la Guía para desarrolladores de AWS SDK for Java.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
ConnectionTimeout Opcional 0 ConnectionTimeout=2000;

Tiempo de espera de la solicitud

Especifica el tiempo de espera de lectura del socket para los clientes HTTP. Este valor se establece para el parámetro ClientConfiguration.requestTimeoutMs del cliente de Athena. Para obtener información sobre el parámetro, consulte Configuración de clientes en la Guía para desarrolladores de AWS SDK for Java.

Nombre de la cadena de conexión Tipo de parámetro Valor predeterminado Ejemplo de la cadena de conexión
RequestTimeout Opcional 10000 RequestTimeout=30000;