Almacenamiento de los resultados de la consulta de SQL en un pandas DataFrame - Amazon SageMaker AI

Almacenamiento de los resultados de la consulta de SQL en un pandas DataFrame

Puede almacenar los resultados de su consulta de SQL en un pandas DataFrame. La forma más sencilla de enviar los resultados de las consultas a un DataFrame es usar el menú desplegable de resultados de consultas Características del editor de SQL de la extensión de SQL de JupyterLab y elegir la opción Pandas dataframe.

Como alternativa, puede añadir el parámetro --output '{"format": "DATAFRAME", "dataframe_name": "dataframe_name"}' a la cadena de conexión.

Por ejemplo, la siguiente consulta extrae los detalles de los clientes con el saldo más alto de la tabla Customer de la base de datos TPCH_SF1 de Snowflake, utilizando tanto pandas como SQL:

  • En este ejemplo, extraemos todos los datos de la tabla de clientes y los guardamos en un DataFrame denominado all_customer_data.

    %%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id snowflake-connection-name --metastore-type GLUE_CONNECTION SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMER
    Saved results to all_customer_data
  • A continuación, extraemos los detalles del saldo de cuenta más alto del DataFrame.

    all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values
    array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15, '25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'], dtype=object)