AWS Analytics category icon Analitik - Sekilas tentang Amazon Web Services

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

AWS Analytics category icon Analitik

Amazon Athena

Amazon Athena adalah layanan kueri interaktif yang memudahkan untuk menganalisis data di Amazon S3 menggunakan SQL standar. Athena tidak memiliki server, sehingga tidak ada infrastruktur untuk dikelola dan Anda hanya membayar untuk mengkueri yang Anda jalankan.

Athena mudah digunakan. Cukup arahkan ke data Anda di Amazon S3, tentukan skema, dan mulai kueri menggunakan SQL standar. Sebagian besar hasil disampaikan dalam hitungan detik. Dengan Athena, tidak perlu pekerjaan ekstrak, transformasi, dan beban (ETL) yang kompleks untuk menyiapkan data Anda untuk dianalisis. Ini memudahkan siapa saja dengan keterampilan SQL untuk menganalisis kumpulan data skala besar dengan cepat.

Athena out-of-the-box terintegrasi dengan AWS Glue Data Catalog, memungkinkan Anda membuat repositori metadata terpadu di berbagai layanan, merayapi sumber data untuk menemukan skema dan mengisi Katalog Anda dengan definisi tabel dan partisi yang baru dan dimodifikasi, serta mempertahankan versi skema.

Amazon CloudSearch

Amazon CloudSearch adalah layanan terkelola AWS Cloud yang membuatnya sederhana dan hemat biaya untuk menyiapkan, mengelola, dan menskalakan solusi pencarian untuk situs web atau aplikasi Anda. Amazon CloudSearch mendukung 34 bahasa dan fitur pencarian populer seperti penyorotan, pelengkapan otomatis, dan pencarian geospasial.

Amazon DataZone

Amazon DataZone adalah layanan manajemen data yang dapat Anda gunakan untuk mempublikasikan data dan membuatnya tersedia untuk katalog data bisnis melalui aplikasi web yang dipersonalisasi. Anda dapat mengakses data Anda dengan lebih aman di mana pun data tersebut disimpan — di, di tempat AWS, atau di aplikasi SaaS seperti Salesforce. Amazon DataZone menyederhanakan pengalaman Anda di seluruh AWS layanan seperti Amazon Redshift, Amazon Athena AWS Glue,,, AWS Lake Formation dan Amazon. QuickSight

Amazon EMR

Amazon EMR adalah platform cloud big data terkemuka di industri untuk memproses sejumlah besar data menggunakan alat open source seperti Apache Spark, Apache Hive, ApacheHBase, Apache Flink, ApacheHudi, dan Presto. Amazon EMR memudahkan pengaturan, pengoperasian, dan skala lingkungan big data Anda dengan mengotomatiskan tugas yang memakan waktu seperti penyediaan kapasitas dan tuning cluster. Dengan Amazon EMR, Anda dapat menjalankan analisis skala petabyte dengan biaya kurang dari setengah biaya solusi lokal tradisional dan lebih dari 3x lebih cepat daripada Apache Spark standar. Anda dapat menjalankan beban kerja di instans Amazon EC2, di kluster Amazon Elastic Kubernetes Service (Amazon EKS), atau lokal menggunakan Amazon EMR aktif. AWS Outposts

Amazon FinSpace

Amazon FinSpaceadalah manajemen data dan layanan analitik yang dibuat khusus untuk industri jasa keuangan (FSI). FinSpace mengurangi waktu yang Anda habiskan untuk menemukan dan menyiapkan petabyte data keuangan agar siap dianalisis dari bulan ke menit.

Organisasi jasa keuangan menganalisis data dari penyimpanan data internal seperti portofolio, aktuaria, dan sistem manajemen risiko serta petabyte data dari umpan data pihak ketiga, seperti harga sekuritas historis dari bursa saham. Diperlukan waktu berbulan-bulan untuk menemukan data yang tepat, mendapatkan izin untuk mengakses data dengan cara yang sesuai, dan mempersiapkannya untuk analisis.

FinSpace menghilangkan beban berat membangun dan memelihara sistem manajemen data untuk analitik keuangan. Dengan FinSpace, Anda mengumpulkan data dan membuat katalog berdasarkan konsep bisnis yang relevan seperti kelas aset, klasifikasi risiko, atau wilayah geografis. FinSpace memudahkan untuk menemukan dan berbagi data di seluruh organisasi Anda sesuai dengan persyaratan kepatuhan Anda. Anda menentukan kebijakan akses data Anda di satu tempat dan FinSpace menegakkannya sambil menyimpan log audit untuk memungkinkan kepatuhan dan pelaporan aktivitas. FinSpace juga mencakup perpustakaan 100+ fungsi, seperti bilah waktu dan Bollinger band, bagi Anda untuk menyiapkan data untuk analisis.

Amazon Kinesis

Amazon Kinesis memudahkan pengumpulan, proses, dan analisis data streaming real-time sehingga Anda bisa mendapatkan wawasan tepat waktu dan bereaksi cepat terhadap informasi baru. Amazon Kinesis menawarkan kemampuan utama untuk memproses data streaming secara hemat biaya pada skala apa pun, bersama dengan fleksibilitas untuk memilih alat yang paling sesuai dengan persyaratan aplikasi Anda. Dengan Amazon Kinesis, Anda dapat menyerap data real-time seperti video, audio, log aplikasi, clickstream situs web, dan data telemetri IoT untuk pembelajaran mesin (ML), analitik, dan aplikasi lainnya. Amazon Kinesis memungkinkan Anda untuk memproses dan menganalisis data saat tiba dan merespons secara instan alih-alih harus menunggu sampai semua data Anda dikumpulkan sebelum pemrosesan dapat dimulai.

Amazon Kinesis saat ini menawarkan empat layanan: Firehose, Layanan Terkelola untuk Apache Flink, Kinesis Data Streams, dan Kinesis Video Streams.

Amazon Data Firehose

Amazon Data Firehose adalah cara termudah untuk memuat data streaming secara andal ke dalam penyimpanan data dan alat analitik. Ini dapat menangkap, mengubah, dan memuat data streaming ke Amazon S3, Amazon Redshift, OpenSearch Amazon Service, dan Splunk, memungkinkan analisis hampir real-time dengan alat intelijen bisnis dan dasbor yang sudah Anda gunakan saat ini. Ini adalah layanan yang dikelola sepenuhnya yang secara otomatis menskalakan agar sesuai dengan throughput data Anda dan tidak memerlukan administrasi berkelanjutan. Ini juga dapat mengumpulkan, mengompres, mengubah, dan mengenkripsi data sebelum memuatnya, meminimalkan jumlah penyimpanan yang digunakan di tempat tujuan dan meningkatkan keamanan.

Anda dapat dengan mudah membuat aliran pengiriman Firehose dari AWS Management Console, mengonfigurasinya dengan beberapa klik, dan mulai mengirim data ke aliran dari ratusan ribu sumber data untuk dimuat terus menerus ke AWS—semuanya hanya dalam beberapa menit. Anda juga dapat mengonfigurasi aliran pengiriman Anda untuk secara otomatis mengonversi data yang masuk ke format kolom seperti Apache Parquet dan Apache ORC, sebelum data dikirim ke Amazon S3, untuk penyimpanan dan analitik yang hemat biaya.

Layanan Terkelola Amazon untuk Apache Flink

Amazon Managed Service untuk Apache Flink adalah cara termudah untuk menganalisis data streaming, mendapatkan wawasan yang dapat ditindaklanjuti, dan menanggapi kebutuhan bisnis dan pelanggan Anda secara real time. Amazon Managed Service untuk Apache Flink mengurangi kompleksitas membangun, mengelola, dan mengintegrasikan aplikasi streaming dengan layanan lain. AWS Pengguna SQL dapat dengan mudah menanyakan data streaming atau membangun seluruh aplikasi streaming menggunakan templat dan editor SQL interaktif. Pengembang Java dapat dengan cepat membangun aplikasi streaming canggih menggunakan pustaka dan AWS integrasi Java open source untuk mengubah dan menganalisis data secara real-time.

Layanan Terkelola Amazon untuk Apache Flink menangani semua yang diperlukan untuk menjalankan kueri Anda secara terus menerus dan menskalakan secara otomatis agar sesuai dengan volume dan tingkat throughput data yang masuk.

Amazon Kinesis Data Streams

Amazon Kinesis Data Streams adalah layanan streaming data real-time yang dapat diskalakan dan tahan lama secara besar-besaran. Kinesis Data Streams dapat terus menangkap gigabyte data per detik dari ratusan ribu sumber seperti clickstream situs web, aliran peristiwa database, transaksi keuangan, umpan media sosial, log TI, dan peristiwa pelacakan lokasi. Data yang dikumpulkan tersedia dalam milidetik untuk memungkinkan kasus penggunaan analitik real-time seperti dasbor waktu nyata, deteksi anomali waktu nyata, harga dinamis, dan banyak lagi.

Amazon Kinesis Video Streams

Amazon Kinesis Video Streams memudahkan streaming video secara aman dari AWS perangkat yang terhubung ke analitik, ML, pemutaran, dan pemrosesan lainnya. Kinesis Video Streams secara otomatis menyediakan dan secara elastis menskalakan semua infrastruktur yang diperlukan untuk menyerap data video streaming dari jutaan perangkat. Ini juga tahan lama menyimpan, mengenkripsi, dan mengindeks data video di aliran Anda, dan memungkinkan Anda mengakses data Anda melalui API. easy-to-use Kinesis Video Streams memungkinkan Anda memutar video untuk dilihat langsung dan sesuai permintaan, dan dengan cepat membangun aplikasi yang memanfaatkan visi komputer dan analitik video melalui integrasi dengan Amazon Rekognition Video, dan pustaka untuk kerangka kerja HTML seperti Apache,, dan OpenCV. MxNet TensorFlow

OpenSearch Layanan Amazon

Amazon OpenSearch Service (OpenSearch Service) memudahkan penerapan, pengamanan, pengoperasian, dan skala OpenSearch untuk mencari, menganalisis, dan memvisualisasikan data secara real-time. Dengan Amazon OpenSearch Service, Anda mendapatkan easy-to-use API dan kemampuan analitik real-time untuk mendukung kasus penggunaan seperti analitik log, pencarian teks lengkap, pemantauan aplikasi, dan analitik clickstream, dengan ketersediaan, skalabilitas, dan keamanan tingkat perusahaan. Layanan ini menawarkan integrasi dengan alat sumber terbuka seperti OpenSearch Dasbor dan Logstash untuk konsumsi data dan visualisasi. Ini juga terintegrasi secara mulus dengan AWS layanan lain seperti Amazon Virtual Private Cloud (Amazon VPC), (), Amazon Data Firehose,AWS KMS, AWS Key Management Service(AWS Identity and Access Management IAM), Amazon Cognito AWS Lambda, dan CloudWatchAmazon, sehingga Anda dapat beralih dari data mentah ke wawasan yang dapat ditindaklanjuti dengan cepat.

Amazon Tanpa OpenSearch Server

Amazon OpenSearch Serverless adalah opsi tanpa server di Amazon Service. OpenSearch Sebagai pengembang, Anda dapat menggunakan Tanpa OpenSearch Server untuk menjalankan beban kerja skala petabyte tanpa mengonfigurasi, mengelola, dan menskalakan cluster. OpenSearch Anda mendapatkan waktu respons milidetik interaktif yang sama dengan OpenSearch Layanan dengan kesederhanaan lingkungan tanpa server.

Mesin vektor untuk Amazon OpenSearch Tanpa Server, menambahkan kemampuan penyimpanan dan pencarian vektor yang sederhana, dapat diskalakan, dan berkinerja tinggi untuk membantu pengembang membangun pengalaman penelusuran yang diperkuat ML dan aplikasi AI generatif tanpa harus mengelola infrastruktur basis data vektor. Kasus penggunaan untuk koleksi pencarian vektor termasuk pencarian gambar, pencarian dokumen, pengambilan musik, rekomendasi produk, pencarian video, pencarian berbasis lokasi, deteksi penipuan, dan deteksi anomali.

Amazon Redshift

Amazon Redshift adalah gudang data cloud yang paling banyak digunakan. Ini membuatnya cepat, sederhana dan hemat biaya untuk menganalisis semua data Anda menggunakan SQL standar dan alat Business Intelligence (BI) yang ada. Ini memungkinkan Anda untuk menjalankan kueri analitik kompleks terhadap terabyte hingga petabyte data terstruktur dan semi-terstruktur, menggunakan optimasi kueri canggih, penyimpanan kolumnar pada penyimpanan berkinerja tinggi, dan penyelesaian kueri paralel secara besar-besaran. Sebagian besar hasil kembali dalam hitungan detik. Anda dapat memulai dari yang kecil hanya dengan $0,25 per jam tanpa komitmen dan skala ke petabyte data seharga $1.000 per terabyte per tahun, kurang dari sepersepuluh biaya solusi lokal tradisional.

Amazon Redshift Tanpa Server

Amazon Redshift Serverless memudahkan menjalankan dan menskalakan analitik tanpa harus mengelola infrastruktur gudang data Anda. Pengembang, ilmuwan data, dan analis dapat bekerja di seluruh basis data, gudang data, dan data lake untuk membangun aplikasi pelaporan dan dasbor, melakukan analisis mendekati waktu nyata, berbagi dan berkolaborasi dalam data, serta membangun dan melatih model pembelajaran mesin (ML). Beralih dari sejumlah besar data ke wawasan dalam hitungan detik. Amazon Redshift Serverless secara otomatis menyediakan dan menskalakan kapasitas gudang data secara cerdas untuk memberikan kinerja yang cepat bahkan untuk beban kerja yang paling menuntut dan tidak dapat diprediksi, dan Anda hanya membayar untuk apa yang Anda gunakan. Cukup muat data dan mulai kueri segera di Amazon Redshift Query Editor atau di alat intelijen bisnis (BI) favorit Anda dan terus nikmati kinerja harga terbaik dan fitur SQL yang sudah dikenal di easy-to-use lingkungan administrasi nol.

Amazon QuickSight

Amazon QuickSight adalah layanan intelijen bisnis (BI) yang cepat dan bertenaga cloud yang memudahkan Anda menyampaikan wawasan kepada semua orang di organisasi Anda. QuickSight memungkinkan Anda membuat dan menerbitkan dasbor interaktif yang dapat diakses dari browser atau perangkat seluler. Anda dapat menyematkan dasbor ke dalam aplikasi Anda, menyediakan pelanggan Anda dengan analisis swalayan yang kuat. Amazon QuickSight dengan mudah menskalakan ke puluhan ribu pengguna tanpa perangkat lunak apa pun untuk diinstal, server untuk digunakan, atau infrastruktur untuk dikelola.

AWS Clean Rooms

AWS Clean Roomsmembantu perusahaan dan mitra mereka dengan lebih mudah dan aman menganalisis dan berkolaborasi pada kumpulan data kolektif mereka—tanpa berbagi atau menyalin data dasar satu sama lain. Dengan AWS Clean Rooms, pelanggan dapat membuat ruang bersih data yang aman dalam hitungan menit, dan berkolaborasi dengan perusahaan lain AWS Cloud untuk menghasilkan wawasan unik tentang kampanye iklan, keputusan investasi, serta penelitian dan pengembangan.

AWS Data Exchange

AWS Data Exchangememudahkan untuk menemukan, berlangganan, dan menggunakan data pihak ketiga di cloud. Penyedia data yang memenuhi syarat termasuk merek-merek terkemuka di kategori seperti Reuters, yang mengumpulkan data dari lebih dari 2,2 juta berita unik per tahun dalam berbagai bahasa; Change Healthcare, yang memproses dan menganonimkan lebih dari 14 miliar transaksi perawatan kesehatan dan $1 triliun klaim setiap tahun; Dun & Bradstreet, yang mengelola database lebih dari 330 juta catatan bisnis global; dan Foursquare, yang data lokasinya berasal dari 220 juta konsumen unik dan mencakup lebih dari 60 juta juta tempat komersial global.

Setelah berlangganan produk data, Anda dapat menggunakan AWS Data Exchange API untuk memuat data langsung ke Amazon S3 dan kemudian menganalisisnya dengan berbagai AWS macam analitik dan layanan ML. Misalnya, perusahaan asuransi properti dapat berlangganan data untuk menganalisis pola cuaca historis untuk mengkalibrasi persyaratan pertanggungan asuransi di berbagai geografi; restoran dapat berlangganan data populasi dan lokasi untuk mengidentifikasi wilayah optimal untuk ekspansi; peneliti akademis dapat melakukan studi tentang perubahan iklim dengan berlangganan data tentang emisi karbon dioksida; dan profesional kesehatan dapat berlangganan data agregat dari uji klinis historis untuk mempercepat kegiatan penelitian mereka.

Untuk penyedia data, AWS Data Exchange memudahkan untuk menjangkau jutaan AWS pelanggan yang bermigrasi ke cloud dengan menghilangkan kebutuhan untuk membangun dan memelihara infrastruktur untuk penyimpanan data, pengiriman, penagihan, dan pemberian hak.

AWS Data Pipeline

AWS Data Pipelineadalah layanan web yang membantu Anda memproses dan memindahkan data secara andal antara layanan AWS komputasi dan penyimpanan yang berbeda, serta sumber data lokal, pada interval tertentu. Dengan AWS Data Pipeline, Anda dapat secara teratur mengakses data Anda di tempat penyimpanan, mengubah, dan memprosesnya dalam skala besar, dan dengan mudah mentransfer hasilnya ke layanan AWS seperti Amazon S3, Amazon RDS, Amazon DynamoDB, dan Amazon EMR.

AWS Data Pipeline membantu Anda dengan mudah membuat beban kerja pemrosesan data yang kompleks yang toleran terhadap kesalahan, berulang, dan sangat tersedia. Anda tidak perlu khawatir tentang memastikan ketersediaan sumber daya, mengelola dependensi antar-tugas, mencoba kembali kegagalan sementara atau batas waktu dalam tugas individu, atau membuat sistem pemberitahuan kegagalan. AWS Data Pipeline juga memungkinkan Anda untuk memindahkan dan memproses data yang sebelumnya terkunci di silo data lokal.

AWS Resolusi Entitas

AWS Entity Resolution adalah layanan yang membantu Anda mencocokkan dan menautkan catatan terkait yang disimpan di beberapa aplikasi, saluran, dan penyimpanan data tanpa membuat solusi khusus. Dengan menggunakan teknik berbasis aturan yang fleksibel dan dapat dikonfigurasi, Resolusi AWS Entitas dapat menghapus catatan duplikat, membuat profil pelanggan dengan menghubungkan interaksi pelanggan yang berbeda, dan mempersonalisasi pengalaman di seluruh kampanye iklan dan pemasaran, program loyalitas, dan e-commerce. Misalnya, Anda dapat membuat tampilan terpadu interaksi pelanggan dengan menautkan peristiwa terbaru, seperti klik iklan, pengabaian keranjang, dan pembelian, ke dalam ID kecocokan yang unik.

AWS Glue

AWS Glueadalah layanan ekstrak, transformasi, dan pemuatan (ETL) yang dikelola sepenuhnya yang memudahkan pelanggan untuk menyiapkan dan memuat data mereka untuk analitik. Anda dapat membuat dan menjalankan pekerjaan ETL dengan beberapa klik di file. AWS Management Console Anda cukup menunjuk AWS Glue ke data yang disimpan AWS, dan AWS Glue menemukan data Anda dan menyimpan metadata terkait (seperti definisi tabel dan skema) di. AWS Glue Data Catalog Setelah dikatalogkan, data Anda segera dapat dicari, dapat ditanyakan, dan tersedia untuk ETL.

AWS Glue Mesin Integrasi Data menyediakan akses ke data menggunakan Apache Spark, PySpark, dan Python. Dengan penambahan AWS Glue untuk Ray, Anda dapat meningkatkan skala beban kerja Anda menggunakan Ray, kerangka kerja komputasi terpadu sumber terbuka.

AWS Glue Kualitas Data dapat mengukur dan memantau kualitas data data data lake berbasis Amazon S3, gudang data, dan repositori data lainnya. Ini secara otomatis menghitung statistik, merekomendasikan aturan kualitas, dan dapat memantau dan memperingatkan Anda ketika mendeteksi data yang hilang, basi, atau buruk. Anda dapat mengaksesnya di AWS Glue Data Catalog dan di pekerjaan AWS Glue Data Catalog ETL.

AWS Lake Formation

AWS Lake Formationadalah layanan yang membuatnya mudah untuk mengatur danau data yang aman dalam beberapa hari. Sebuah danau data adalah repositori terpusat, dikurasi, dan aman yang menyimpan semua data Anda, baik dalam bentuk aslinya dan yang disiapkan untuk analisis. Danau data memungkinkan Anda untuk menguraikan silo data dan menggabungkan berbagai jenis analitik untuk mendapatkan wawasan dan memandu keputusan bisnis yang lebih baik.

Namun, menyiapkan dan mengelola data lake saat ini melibatkan banyak tugas manual, rumit, dan memakan waktu. Pekerjaan ini mencakup memuat data dari beragam sumber, memantau aliran data tersebut, menyiapkan partisi, mengaktifkan enkripsi dan mengelola kunci, menentukan pekerjaan transformasi dan memantau operasinya, mengatur ulang data ke dalam format kolom, mengonfigurasi pengaturan kontrol akses, menghilangkan duplikasi data yang berlebihan, mencocokkan catatan tertaut, memberikan akses ke kumpulan data, dan mengaudit akses dari waktu ke waktu.

Membuat data lake dengan Lake Formation semudah menentukan di mana data Anda berada dan akses data dan kebijakan keamanan apa yang ingin Anda terapkan. Lake Formation kemudian mengumpulkan dan membuat katalog data dari database dan penyimpanan objek, memindahkan data ke danau data Amazon S3 baru Anda, membersihkan dan mengklasifikasikan data menggunakan algoritme ML, dan mengamankan akses ke data sensitif Anda. Pengguna Anda kemudian dapat mengakses katalog data terpusat yang menjelaskan kumpulan data yang tersedia dan penggunaannya yang sesuai. Pengguna Anda kemudian memanfaatkan kumpulan data ini dengan pilihan analitik dan layanan MLnya, seperti Amazon EMR untuk Apache Spark, Amazon Redshift, Amazon Athena, dan Amazon. SageMaker QuickSight

Amazon Managed Streaming for Apache Kafka (Amazon MSK)

Amazon Managed Streaming for Apache Kafka (Amazon MSK) adalah layanan yang dikelola sepenuhnya yang memudahkan Anda membangun dan menjalankan aplikasi yang menggunakan Apache Kafka untuk memproses data streaming. Apache Kafka adalah platform sumber terbuka untuk membangun saluran dan aplikasi data streaming waktu nyata. Dengan Amazon MSK, Anda dapat menggunakan Apache Kafka API untuk mengisi data lake, mengalirkan perubahan ke dan dari database, serta memberi daya pada aplikasi MS dan analitik.

Cluster Apache Kafka menantang untuk mengatur, menskalakan, dan mengelola dalam produksi. Saat Anda menjalankan Apache Kafka sendiri, Anda perlu menyediakan server, mengonfigurasi Apache Kafka secara manual, mengganti server saat gagal, mengatur tambalan dan peningkatan server, merancang cluster untuk ketersediaan tinggi, memastikan data disimpan dan diamankan dengan tahan lama, pengaturan pemantauan dan alarm, dan rencanakan acara penskalaan dengan hati-hati untuk mendukung perubahan beban. Amazon MSK memudahkan Anda untuk membangun dan menjalankan aplikasi produksi di Apache Kafka tanpa memerlukan keahlian manajemen infrastruktur Apache Kafka. Itu berarti Anda menghabiskan lebih sedikit waktu mengelola infrastruktur dan lebih banyak waktu membangun aplikasi.

Dengan beberapa klik di konsol MSK Amazon, Anda dapat membuat cluster Apache Kafka yang sangat tersedia dengan pengaturan dan konfigurasi berdasarkan praktik terbaik penerapan Apache Kafka. Amazon MSK secara otomatis menyediakan dan menjalankan cluster Apache Kafka Anda. Amazon MSK terus memantau kesehatan klaster dan secara otomatis mengganti node yang tidak sehat tanpa downtime ke aplikasi Anda. Selain itu, Amazon MSK mengamankan cluster Apache Kafka Anda dengan mengenkripsi data saat istirahat.