Almacenamiento de los resultados de la consulta de SQL en un pandas DataFrame

Puede almacenar los resultados de su consulta de SQL en un pandas DataFrame. La forma más sencilla de enviar los resultados de las consultas a un DataFrame es usar el menú desplegable de resultados de consultas Características del editor de SQL de la extensión de SQL de JupyterLab y elegir la opción Pandas dataframe.

Como alternativa, puede añadir el parámetro --output '{"format": "DATAFRAME", "dataframe_name": "dataframe_name"}' a la cadena de conexión.

Por ejemplo, la siguiente consulta extrae los detalles de los clientes con el saldo más alto de la tabla Customer de la base de datos TPCH_SF1 de Snowflake, utilizando tanto pandas como SQL:

En este ejemplo, extraemos todos los datos de la tabla de clientes y los guardamos en un DataFrame denominado all_customer_data.


%%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id snowflake-connection-name --metastore-type GLUE_CONNECTION
SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMER


Saved results to all_customer_data

A continuación, extraemos los detalles del saldo de cuenta más alto del DataFrame.


all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values


array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15,
'25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'],
dtype=object)

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Creación de una conexión sencilla

Anulación de propiedades de conexiones