Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Conexiones de fuentes de datos de extensión SQL
Antes de utilizar la extensión SQL en las JupyterLab libretas, los administradores o los usuarios deben crear AWS Glue conexiones a sus fuentes de datos. La extensión SQL permite conectarse a fuentes de datos como Amazon Redshift, Amazon Athena o Snowflake.
Para configurar las conexiones, los administradores primero deben asegurarse de que la configuración de red permita la comunicación entre Studio y las fuentes de datos y, a continuación, conceder los permisos de IAM necesarios para que Studio pueda acceder a las fuentes de datos. Para obtener información sobre cómo los administradores pueden configurar la red, consulteConfiguración del acceso a la red entre Studio y los orígenes de datos (para administradores). Para obtener información sobre las políticas que se deben configurar, consulteConfigure los permisos de IAM para acceder a las fuentes de datos (para administradores). Una vez configuradas las conexiones, los científicos de datos pueden usar la extensión SQL en sus JupyterLab cuadernos para buscar y consultar las fuentes de datos conectadas.
nota
Le recomendamos que guarde sus credenciales de acceso a la base de datos como un secreto en Secrets Manager. Para obtener información sobre cómo crear secretos para almacenar las credenciales de acceso a Amazon Redshift o Snowflake, consulte. Cree secretos para las credenciales de acceso a la base de datos en Secrets Manager
En esta sección se explica cómo configurar una AWS Glue conexión y se enumeran los permisos de IAM necesarios para que la JupyterLab aplicación Studio acceda a los datos a través de la conexión.
nota
Amazon SageMaker Assets integra Amazon DataZone con Studio. Incluye un plan de SageMaker IA para que los administradores creen entornos de Studio a partir de DataZone proyectos de Amazon dentro de un DataZone dominio de Amazon.
Los usuarios de una JupyterLab aplicación lanzada desde un dominio de Studio creado con el blueprint pueden acceder automáticamente a AWS Glue las conexiones a los activos de datos de su DataZone catálogo de Amazon cuando utilizan la extensión SQL. Esto permite consultar esos orígenes de datos sin tener que configurar las conexiones manualmente.