Konsep untuk deteksi anomali atau outlier - Amazon QuickSight

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konsep untuk deteksi anomali atau outlier

Amazon QuickSight menggunakan kata anomali untuk menggambarkan titik data yang berada di luar pola distribusi keseluruhan. Ada banyak kata lain untuk anomali, yang merupakan istilah ilmiah, termasuk outlier, penyimpangan, keanehan, pengecualian, penyimpangan, kebiasaan, dan banyak lagi. Istilah yang Anda gunakan mungkin didasarkan pada jenis analisis yang Anda lakukan, atau jenis data yang Anda gunakan, atau bahkan hanya preferensi grup Anda. Titik-titik data terpencil ini mewakili suatu entitas—seseorang, tempat, benda, atau waktu—yang luar biasa dalam beberapa hal.

Manusia dengan mudah mengenali pola dan melihat hal-hal yang tidak seperti yang lain. Indera kita memberikan informasi ini untuk kita. Jika polanya sederhana, dan hanya ada sedikit data, Anda dapat dengan mudah membuat grafik untuk menyorot outlier dalam data Anda. Beberapa contoh sederhana termasuk yang berikut:

  • Balon merah dalam kelompok yang biru

  • Kuda pacu yang jauh di depan yang lain

  • Seorang anak yang tidak memperhatikan selama kelas

  • Sehari ketika pesanan online naik, tetapi pengiriman turun

  • Seseorang yang sembuh, di mana orang lain tidak

Beberapa titik data mewakili peristiwa penting, dan yang lain mewakili kejadian acak. Analisis mengungkap data mana yang layak diselidiki, berdasarkan faktor pendorong (pendorong utama) apa yang berkontribusi pada acara tersebut. Pertanyaan sangat penting untuk analisis data. Mengapa itu terjadi? Apa hubungannya dengan? Apakah itu terjadi hanya sekali atau berkali-kali? Apa yang dapat Anda lakukan untuk mendorong atau mencegah lebih seperti itu?

Memahami bagaimana dan mengapa ada variasi, dan apakah ada pola dalam variasi, membutuhkan lebih banyak pemikiran. Tanpa bantuan pembelajaran mesin, setiap orang mungkin sampai pada kesimpulan yang berbeda, karena mereka memiliki pengalaman dan informasi yang berbeda. Oleh karena itu, setiap orang mungkin membuat keputusan bisnis yang sedikit berbeda. Jika ada banyak data atau variabel untuk dipertimbangkan, itu bisa memerlukan sejumlah besar analisis.

Deteksi anomali bertenaga ML mengidentifikasi penyebab dan korelasi untuk memungkinkan Anda membuat keputusan berbasis data. Anda masih memiliki kendali untuk menentukan bagaimana Anda ingin pekerjaan bekerja pada data Anda. Anda dapat menentukan parameter Anda sendiri, dan memilih opsi tambahan, seperti mengidentifikasi driver utama dalam analisis kontribusi. Atau Anda dapat menggunakan pengaturan default. Bagian berikut memandu Anda melalui proses penyiapan, dan memberikan penjelasan untuk opsi yang tersedia.