Menyimpan hasil kueri SQL di panda DataFrame - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menyimpan hasil kueri SQL di panda DataFrame

Anda dapat menyimpan hasil kueri SQL Anda di panda DataFrame. Cara termudah untuk menampilkan hasil kueri ke a DataFrame adalah dengan menggunakan dropdown Fitur editor SQL dari ekstensi JupyterLab SQL hasil kueri dan memilih opsi kerangka data Pandas.

Atau, Anda dapat menambahkan parameter --output '{"format": "DATAFRAME", "dataframe_name": "dataframe_name"}' ke string koneksi Anda.

Misalnya, kueri berikut mengekstrak detail pelanggan dengan saldo tertinggi dari Customer tabel di TPCH_SF1 database Snowflake, menggunakan keduanya pandas dan SQL:

  • Dalam contoh ini, kami mengekstrak semua data dari tabel pelanggan dan menyimpannya kemudian dalam DataFrame namaall_customer_data.

    %%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id snowflake-connection-name --metastore-type GLUE_CONNECTION SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMER
    Saved results to all_customer_data
  • Selanjutnya, kami mengekstrak detail saldo akun tertinggi dari DataFrame.

    all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values
    array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15, '25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'], dtype=object)