Guarda los resultados de una consulta SQL en forma de pandas DataFrame - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Guarda los resultados de una consulta SQL en forma de pandas DataFrame

Puedes almacenar los resultados de tu consulta SQL en un DataFrame pandas. La forma más sencilla de enviar los resultados de una consulta a DataFrame es utilizar el menú desplegable de Características del editor SQL de la extensión JupyterLab SQL resultados de la consulta y elegir la opción de marco de datos de Pandas.

Como alternativa, puede añadir el parámetro --output '{"format": "DATAFRAME", "dataframe_name": "dataframe_name"}' a la cadena de conexión.

Por ejemplo, la siguiente consulta extrae los detalles de los clientes con el saldo más alto de la tabla Customer de la base de datos TPCH_SF1 de Snowflake, utilizando tanto pandas como SQL:

  • En este ejemplo, extraemos todos los datos de la tabla de clientes y los guardamos en un nombre. DataFrame all_customer_data

    %%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id snowflake-connection-name --metastore-type GLUE_CONNECTION SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMER
    Saved results to all_customer_data
  • A continuación, extraemos los detalles del saldo más alto de la cuenta DataFrame.

    all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values
    array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15, '25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'], dtype=object)