Lampiran: Sumber data AWS yang didukung Microsoft Power BI - Menggunakan Microsoft Power BI dengan AWS Cloud

Lampiran: Sumber data AWS yang didukung Microsoft Power BI

Daftar lengkap sumber data yang didukung disediakan oleh Microsoft (lihat Sumber data Power BI); namun, bagian untuk setiap sumber data AWS berikut menyediakan panduan penggunaan dan konfigurasi yang mungkin bermanfaat bagi beberapa pembaca.

Amazon Redshift

Amazon Redshift adalah layanan gudang data berskala petabyte dan terkelola penuh di AWS Cloud. Gudang data Amazon Redshift merupakan kumpulan sumber daya komputasi yang disebut simpul, yang disusun ke dalam grup yang disebut klaster. Setiap klaster menjalankan mesin Amazon Redshift dan berisi satu basis data atau lebih.

Sebaiknya pertimbangkan untuk menggunakan Amazon Redshift saat:

  • Anda sedang membangun atau bermigrasi ke gudang data cloud native.

  • Anda mungkin perlu menskalakan dari beberapa hingga ratusan Terabyte.

  • Anda ingin mengizinkan pengguna Power BI untuk secara transparan mengakses data dari danau data yang disimpan di Amazon S3 dan menggabungkannya dengan tabel di gudang data.

  • Beban kerja kueri Anda meliputi:

    • Kueri yang menghitung agregasi pada tabel besar (multi-gigabyte dan multi-terabyte).

    • SQL sangat kompleks dengan beberapa gabungan dan sub-kueri.

    • Campuran kueri analitik yang kompleks dan kueri sederhana sangat tersaring yang digunakan di Dasbor.

Saat menggunakan Amazon Redshift dengan Microsoft Power BI, perhatikan hal-hal berikut:

  • Amazon Redshift didukung secara native sebagai sumber data Power BI di layanan Microsoft Power BI Desktop dan Power BI, dan masing-masing mendukung mode kueri impor dan langsung.

  • Meskipun klaster Redshift dapat diluncurkan di subnet publik dan dikonfigurasikan agar memungkinkan akses dari internet, mayoritas pelanggan lebih memilih untuk meluncurkannya di subnet privat demi meningkatkan keamanan. Saat menggunakan subnet privat, gunakan gateway data on-premise untuk menyambung dari layanan Power BI ke Amazon Redshift.

  • Konektor Redshift mendukung Azure AD Authentication di Power BI Desktop dan layanan.

  • Tabel eksternal yang diakses melalui Spectrum diperlakukan sama dengan tabel Redshift native, dan Power BI tidak memiliki cara untuk membedakannya. Saat mengakses data dalam tabel eksternal, pastikan bahwa:

    • Kolom yang berisi string karakter dikatalogkan sebagai 'VARCHAR' di Katalog Data AWS Glue dan bukan sebagai 'STRING', jika tidak, Power BI akan memunculkan kesalahan berikut: Exception: OLE DB or ODBC error: [Expression.Error] We couldn't fold the expression to the data source. Please try a simpler expression..

    • Kolom yang berisi tipe data kompleks seperti ARRAY, tidak didukung. Ketika kolom yang berisi tipe data yang kompleks digunakan, Power BI akan memunculkan kesalahan berikut: Exception: ODBC: ERROR [42703] [Microsoft]Amazon Redshift Error occurred while trying to execute a query

      Jika Anda perlu memasukkannya ke dalam model Anda, Anda dapat mengaktifkan serialisasi JSON (di Amazon Redshift) di tingkat pengguna atau menyimpan tipe data kompleks dalam kolom SUPER pada tabel native.

Amazon RDS

Amazon RDS memudahkan penyiapan, pengoperasian, dan penskalaan basis data relasional di cloud. Amazon RDS tersedia pada beberapa tipe instans basis data (yang dioptimalkan untuk memori, performa, atau I/O) dan memberikan enam mesin basis data familier yang dapat dipilih, termasuk Amazon Aurora, PostgreSQL, MySQL, MariaDB, Oracle Database, dan SQL Server.

Sebaiknya pertimbangkan untuk menggunakan RDS saat:

  • Anda membangun penyimpanan data operasional.

  • Anda memigrasikan gudang data SQL Server atau Oracle Database ke cloud tanpa ingin memfaktor ulang (refactor).

  • Beban kerja kueri Anda meliputi:

    • Kueri yang mengakses data sangat tersaring pada tabel yang dapat diindeks dengan mudah.

    • Kueri analitik pada tabel berukuran kecil-hingga-menengah (gigabyte).

    • Perpaduan antara kueri analitik berkompleksitas menengah dan kueri sederhana sangat tersaring yang digunakan di Dasbor.

Saat menggunakan Amazon RDS dengan Microsoft Power BI, perhatikan hal-hal berikut:

  • Amazon RDS menyediakan beberapa mesin basis data termasuk SQL Server, MariaDB, MySQL, Oracle Database, dan PostgreSQL. Perhatikan bahwa mesin basis data tercantum di layanan Power BI Desktop dan Power BI, bukan di layanan Amazon RDS.

  • Untuk Amazon Aurora, gunakan tipe koneksi My SQL atau PostgreSQL, tergantung pada mesin basis data pilihan Anda.

  • Meskipun instans Amazon RDS dapat diluncurkan di subnet publik dan dikonfigurasikan agar memungkinkan akses dari internet, sebagian besar pelanggan lebih memilih untuk meluncurkannya di subnet privat demi meningkatkan keamanan. Saat menggunakan subnet privat, gunakan gateway data on premise untuk menyambung dari layanan Power BI ke RDS.

  • Dengan Amazon RDS, Anda dapat menerapkan beberapa edisi SQL Server (2012, 2014, 2016, 2017, dan 2019) termasuk Express, Web, Standard, dan Enterprise.

Amazon Athena

Amazon Athena adalah layanan kueri interaktif yang memudahkan analisis data di Amazon S3 dengan menggunakan SQL standar. Athena terintegrasi secara unik dengan Katalog Data AWS Glue, memungkinkan Anda untuk membuat tempat penyimpanan metadata terpadu di berbagai layanan, mengunjungi sumber data untuk menemukan skema dan mengisi Katalog Data Anda dengan definisi tabel dan partisi yang baru dan termodifikasi, serta mempertahankan versioning skema.

Anda sebaiknya mempertimbangkan Athena sebagai sumber data saat:

  • Anda ingin membuat kueri danau data Anda secara langsung.

  • Beban kerja kueri Anda meliputi:

    • Kueri yang menghitung agregasi pada tabel besar (multi-gigabyte dan multi-terabyte)

    • SQL ad hoc interaktif, untuk tujuan eksplorasi.

Saat menggunakan Amazon Athena dengan Microsoft Power BI, perhatikan hal-hal berikut:

  • Dengan rilisnya Microsoft Power BI bulan Juli 2021, konektor bersertifikat Microsoft telah disertakan dalam Amazon Athena. Anda dapat menggunakan konektor Microsoft Power BI untuk Amazon Athena untuk menganalisis data dari Amazon Athena di Microsoft Power BI Desktop. Setelah memublikasikan konten ke layanan Power BI, Anda dapat menggunakan gateway data on-premise Microsoft untuk menjaga agar konten tetap diperbarui melalui penyegaran terjadwal atau sesuai permintaan.

  • Konektor Microsoft Power BI untuk Amazon Athena mendukung mode konektivitas data Impor dan Kueri Langsung. Dengan mode Impor, tabel dan kolom yang dipilih diimpor ke Power BI Desktop untuk kueri. Dengan mode Kueri Langsung, tidak ada data yang diimpor atau disalin ke Power BI Desktop, dan sebagai gantinya Power BI Desktop langsung membuat kueri sumber data yang mendasarinya.

  • Untuk informasi selengkapnya tentang konektor Microsoft Power BI untuk Amazon Athena, lihat Menggunakan Konektor Power BI Amazon Athena.

  • Perhatikan bahwa konektor Microsoft Power BI untuk Amazon Athena memerlukan penggunaan driver Amazon Athena ODBC dan konfigurasi DSN ODBC yang valid pada sistem Anda untuk membuat kueri Amazon Athena. Untuk mengunduh driver ODBC terbaru dan untuk informasi konfigurasi, lihat Menyambung ke Amazon Athena dengan ODBC.

  • Untuk tutorial tentang langkah-langkah konfigurasi dan praktik terbaik saat menggunakan konektor Microsoft Power BI untuk Amazon Athena, lihat Membuat dasbor dengan cepat di Microsoft Power BI menggunakan Amazon Athena.

Amazon OpenSearch Service (penerus Amazon Elasticsearch Service)

Anda dapat menggunakan SQL untuk membuat kueri Amazon OpenSearch Service Anda, alih-alih menggunakan DSL kueri penelusuran berbasis JSON. Membuat kueri dengan SQL akan bermanfaat jika Anda sudah terbiasa dengan bahasanya atau ingin mengintegrasikan domain Anda dengan aplikasi yang menggunakannya, seperti Microsoft Power BI.

Sebaiknya pertimbangkan Amazon OpenSearch Service sebagai sumber data saat:

  • Anda memiliki data semi-terstruktur seperti berkas log atau output JSON, dan perlu mencari, menganalisis, atau memvisualisasikan informasi dengan cepat.

Saat menggunakan Amazon OpenSearch Service dengan Microsoft Power BI, perhatikan hal-hal berikut:

AWS Lake Formation

Lake Formation akan membantu Anda mengumpulkan dan membuat katalog data dari basis data dan penyimpanan objek, memindahkan data ke danau data Amazon S3 baru, membersihkan dan mengklasifikasikan algoritme machine learning, serta melindungi akses ke data sensitif Anda. Pengguna Anda dapat mengakses katalog data tersentralisasi, yang menjelaskan set data yang tersedia beserta penggunaannya secara tepat. Pengguna Anda selanjutnya dapat memanfaatkan set data tersebut dengan layanan analitik dan machine learning pilihan mereka, seperti Amazon Redshift, Amazon Athena, dan Amazon EMR (dalam versi beta) untuk Apache Spark. Lake Formation membangun berdasarkan kemampuan yang tersedia di AWS Glue.

Sebaiknya pertimbangkan Lake Formation jika Anda memerlukan akses tingkat terperinci (baris dan kolom) ke danau data Anda alih-alih kontrol berbasis IAM tradisional.

Saat menggunakan Lake Formation dengan Microsoft Power BI, perhatikan hal-hal berikut:

  • Untuk membuat kueri data dari Katalog Data Lake Formation dengan layanan Power BI Desktop atau Power BI, gunakan proses dan konfigurasi yang sama dengan membuat kueri data di Athena. Jika Anda memanfaatkan model izin Lake Formation, pastikan bahwa konfigurasi DSN ODBC untuk Amazon Athena memiliki kunci properti “LakeformationEnabled” yang disetel ke nilai “true” (benar). Proses ini menginformasikan driver Amazon Athena ODBC untuk menggunakan layanan Lake Formation untuk otorisasi, bukan menggunakan AWS Security Token Service secara langsung. Untuk informasi lebih lanjut, lihat dokumentasi untuk Menghubungkan ke Amazon Athena dengan ODBC.

  • Pengaturan “Hanya gunakan kontrol akses IAM” yang diaktifkan agar kompatibel dengan perilaku Katalog Data yang ada akan memberikan kompatibilitas penuh.

  • Meningkatkan Izin Data AWS Glue ke Model Lake Formation mungkin memunculkan ketidakcocokan dan harus diuji sebelum digunakan. Pengujian awal menunjukkan bahwa persetujuan atau penolakan tingkat kolom telah disertakan, tetapi pemfilteran tingkat baris dan sel belum diuji oleh pembuat, karena masih dalam pratinjau dan dapat berubah.