Parámetros de conexión - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Parámetros de conexión

Las siguientes listas detallan las propiedades de Python compatibles para AWS Glue las conexiones por banco de datos.

Parámetros de conexión de Amazon Redshift

Las AWS Glue conexiones a Amazon Redshift admiten los siguientes parámetros de conexión de Python.

Clave Tipo Descripción Restricciones Obligatoria
auto_create Tipo: boolean Indica si el usuario debe crearse si no existe. El valor predeterminado es false. true, false No
aws_secret_arn Tipo: string El ARN del secreto utilizado para recuperar los parámetros adicionales de la conexión. ARN válido No
cluster_identifier Tipo: string - Longitud máxima: 63 El identificador de clúster del clúster de Amazon Redshift. ^ (?!. *—) [a-z] [a-z0-9-] {0,61} [a-z0-9] $ No
database stringTipo: - Longitud máxima: 127 Nombre de la base de datos a la que se va a conectar. No
database_metadata_current_db_only Tipo: boolean Indica si la aplicación admite catálogos de recursos compartidos de bases de datos múltiples. Por motivos de compatibilidad con versiones anteriores, el valor predeterminado es true para indicar que la aplicación no admite catálogos de datos compartidos de varias bases de datos. true, false No
db_groups Tipo: string Lista separada por comas de los nombres de los grupos de bases de datos existentes a los que se unen en la sesión actual. db_user No
db_user Tipo: string El ID de usuario que se utilizará con Amazon Redshift. No
host Tipo: string - Longitud máxima: 256 El nombre de host del clúster de Amazon Redshift. No
iam Tipo: boolean Marca para habilitar o deshabilitar la autenticación basada en IAM para una conexión. El valor predeterminado es false. true, false No
iam_disable_cache Tipo: boolean Esta opción especifica si las credenciales de IAM se almacenan en caché. El valor predeterminado es true. De este modo, se mejora el rendimiento en los casos en que las solicitudes a la API Gateway tienen limitación controlada. true, false No
max_prepared_statements Tipo: integer El número máximo de declaraciones preparadas que se pueden abrir a la vez. No
numeric_to_float Decimal para flotar Especifica si los valores NUMERIC de los tipos de datos se convertirán de decimales. Por defecto, NUMERIC los valores se reciben como objetos de decimal.Decimal Python. No se recomienda activar esta opción para los casos de uso que prefieran la mayor precisión, ya que los resultados pueden redondearse. Consulte la documentación de Python decimal.Decimalpara comprender las desventajas entre decimal.Decimal y float antes de habilitar esta opción. El valor predeterminado es false. true, false No
port Tipo: integer El número de puerto del clúster de Amazon Redshift. Rango: 1150-655,35 No
profile Tipo: - Longitud máxima: 256 string El nombre del perfil que contiene las credenciales y la AWS CLI configuración utilizadas por. No
region Tipo: string La AWS región en la que se encuentra el clúster. AWS Región válida No
serverless_acct_id Tipo: string - Longitud máxima: 256 El ID de AWS cuenta asociado al recurso sin servidor de Amazon Redshift. No
serverless_work_group Tipo: string - Longitud máxima: 256 El nombre del grupo de trabajo del punto de conexión sin servidor Amazon Redshift. No
ssl Tipo: boolean truesi el SSL está activado. true, false No
ssl_mode Tipo: enum [verify-ca,verify-full, null] La seguridad de la conexión a Amazon Redshift. verify-ca (Se debe usar SSL y se debe verificar el certificado del servidor) y verify-full (se debe usar SSL. El certificado del servidor debe verificarse y el nombre de host del servidor debe coincidir con el atributo de nombre de host del certificado.) son compatibles. Para obtener más información, consulte Configuración de las opciones de seguridad para las conexiones en la documentación de Amazon Redshift. El valor predeterminado es verify-ca. verify-ca, verify-full No
timeout Tipo: integer La cantidad de segundos antes de que la conexión al servidor se agote. 0 No

Parámetros de conexión de Athena

Las conexiones a Athena admiten los siguientes parámetros de AWS Glue conexión de Python.

Clave Tipo Descripción Restricciones Obligatoria
aws_access_key_id Tipo: string - Longitud máxima: 256 Especifica una clave de AWS acceso asociada a una cuenta de IAM. Se recomienda almacenar esta información en. aws_secret Longitud 16-128 No
aws_secret_access_key Tipo: string - Longitud máxima: 256 Parte secreta de una clave de AWS acceso. Recomendamos almacenar esta información enaws_secret. No
aws_secret_arn Tipo: string El ARN del secreto utilizado para recuperar los parámetros adicionales de la conexión. ARN válido No
catalog_name Tipo: string - Longitud máxima: 256 El catálogo que contiene las bases de datos y las tablas a las que se accede con el controlador. Para obtener información sobre los catálogos, consulte DataCatalog. No
duration_seconds Tipo: number La duración de la sesión del rol en segundos. Esta opción puede tener un valor comprendido entre 1 y 12 horas. De forma predeterminada, la duración se establece en 3600 segundos (1 hora). El intervalo va desde 900 segundos (15 minutos) hasta la configuración de duración máxima de la sesión para el rol No
encryption_option Tipo: enum [SSE_S3,SSE_KMS,CSE_KMS, null] Cifrado en reposo para Amazon S3. Consulte la sección Cifrado en reposo en la guía de Athena. SSE_S3, SSE_KMS, CSE_KMS No
kms_key Tipo: string - Longitud máxima: 256 AWS KMS clave si se usa CSE_KMS enencrytion_option. No
poll_interval Tipo: number Intervalo en segundos para sondear el estado de los resultados de la consulta en Athena. No
profile_name Tipo: string - Longitud máxima: 256 El nombre del perfil de AWS configuración cuyas credenciales deben usarse para autenticar la solicitud a Athena. No
region_name Tipo: string La AWS región en la que se ejecutan las consultas. AWS Región válida No
result_reuse_enable Tipo: boolean Habilite la reutilización del resultado de la consulta anterior. true, false No
result_reuse_minutes Tipo: integer Especifica, en minutos, la antigüedad máxima de un resultado de consulta anterior que Athena debe tener en cuenta para su reutilización. El valor predeterminado es 60. >= 1 No
role_arn Tipo: string Función que se utilizará para ejecutar consultas. ARN válido No
schema_name Tipo: string - Longitud máxima: 256 Nombre del esquema predeterminado que se utilizará en la base de datos. No
s3_staging_dir Tipo: string - Longitud máxima: 1024 La ubicación en Amazon S3 donde se almacenan los resultados de la consulta. s3_staging_dirO work_group es obligatorio
work_group Tipo: string El grupo de trabajo en el que se ejecutarán las consultas. Para obtener información sobre los grupos de trabajo, consulte WorkGroup. ^ [a-zA-Z0-9._-] {1.128} $ s3_staging_dirwork_groupO es obligatorio

Parámetros de conexión de Snowflake

Las conexiones a Snowflake admiten los siguientes parámetros de AWS Glue conexión de Python.

Parámetros de conexión de Snowflake
Clave Tipo Descripción Restricciones Obligatoria
account Tipo: string - Longitud máxima: 256 El identificador de la cuenta de Snowflake. El identificador de la cuenta no incluye el snowflakecomputing.com sufijo.
arrow_number_to_decimal Tipo: boolean De forma predeterminada, es False, lo que significa que los valores de la columna NUMBER se devuelven como números de coma flotante de doble precisión ()float64. Establézcalo en True para devolver los valores de las columnas DECIMALES como números decimales (decimal.Decimal) al llamar a los fetch_pandas_batches() métodos fetch_pandas_all() y. true, false No
autocommit Tipo: boolean El valor predeterminado esfalse, lo que respeta el parámetro Snowflake. AUTOCOMMIT falseConfigúrelo en true o habilite o deshabilite el autocommit modo en la sesión, respectivamente. true, false No
aws_secret_arn Tipo: string El ARN del secreto utilizado para recuperar los parámetros adicionales de la conexión. ARN válido No
client_prefetch_threads Tipo: integer El número de subprocesos utilizados para descargar los conjuntos de resultados (4 de forma predeterminada). Si se aumenta el valor, se mejora el rendimiento de la búsqueda, pero se requiere más memoria. No
database Tipo: string - Longitud máxima: 256 El nombre de la base de datos predeterminada que se va a utilizar. No
login_timeout Tipo: integer El tiempo de espera en segundos de la solicitud de inicio de sesión. El valor predeterminado es 60 segundos. La solicitud de inicio de sesión se cancela una vez transcurrido el tiempo de espera si la respuesta HTTP no lo es. success No
network_timeout Tipo: integer El tiempo de espera en segundos para todas las demás operaciones. El valor predeterminado es none (infinito). Una solicitud general se cancela una vez transcurrido el tiempo de espera si la respuesta HTTP no lo es. success No
paramstyle Tipo: string - Longitud máxima: 256 Las sintaxis de los marcadores de posición se utilizan para la sustitución de parámetros al ejecutar consultas SQL desde código Python. El valor predeterminado es pyformat para la vinculación del lado del cliente. Especifique qmark o cambie numeric los formatos de las variables de enlace para el enlace del lado del servidor. No
role Tipo: string - Longitud máxima: 256 El nombre del rol predeterminado que se va a usar. No
schema Tipo: string - Longitud máxima: 256 El nombre del esquema predeterminado que se va a usar en la base de datos. No
timezone Tipo: string - Longitud máxima: 128 Ninguno de forma predeterminada, lo que respeta el parámetro Snowflake. TIMEZONE Establezca una zona horaria válida (por ejemploAmerica/Los_Angeles) para establecer la zona horaria de la sesión. Zona horaria en un formato similar al America/Los_Angeles No
validate_default_parameters Tipo: boolean trueConfigúrelo en para generar una excepción si la base de datos, el esquema o el almacén especificados no existen. El valor predeterminado es false. No
warehouse Tipo: string - Longitud máxima: 256 El nombre del almacén por defecto que se va a utilizar. No