Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Amazon Neptune MLuntuk machine learning pada grafik
Sering ada informasi berharga dalam set data terhubung yang besar yang sulit untuk diekstrak menggunakan kueri berdasarkan intuisi manusia saja. Teknik machine learning (ML) dapat membantu menemukan korelasi tersembunyi dalam grafik dengan miliaran hubungan. Korelasi ini sangat membantu untuk merekomendasikan produk, memprediksi kelayakan kredit, mengidentifikasi penipuan, dan banyak hal lainnya.
Fitur Neptune ML memungkinkan untuk membangun dan melatih model machine learning yang berguna pada grafik besar dalam hitungan jam, bukan minggu. Untuk mencapai hal ini, Neptune MLmenggunakan teknologi graph neural network (GNN) yang didukung oleh Amazon SageMaker
catatan
Grafik vertex diidentifikasi dalam model Neptune ML sebagai “simpul”. Sebagai contoh, klasifikasi vertex menggunakan model machine learning klasifikasi simpul, dan regresi vertex menggunakan model regresi simpul.
Apa yang bisa dilakukan Neptune ML
Neptune mendukung inferensi transduktif, yang mengembalikan prediksi yang dihitung sebelumnya pada saat pelatihan, berdasarkan data grafik Anda pada waktu itu, dan inferensi induktif, yang mengembalikan menerapkan pemrosesan data dan evaluasi model secara real time, berdasarkan data saat ini. Lihat Perbedaan antara inferensi induktif dan transduktif.
Neptune MLdapat melatih model machine learning untuk mendukung lima kategori inferensi yang berbeda:
Jenis tugas inferensi saat ini didukung oleh Neptune ML
-
Klasifikasi simpul — memprediksi fitur kategoris dari properti vertex.
Misalnya, film yang diberikan The Shawshank Redemption, Neptune ML dapat memprediksi properti
genre
-nya sebagaistory
dari satu set kandidat[story, crime, action, fantasy, drama, family, ...]
.Ada dua jenis tugas klasifikasi simpul:
Klasifikasi kelas tunggal: Dalam tugas semacam ini, setiap simpul memiliki hanya satu fitur target. Sebagai contoh, properti,
Place_of_birth
dariAlan Turing
memiliki nilaiUK
.Klasifikasi kelas ganda: Dalam tugas semacam ini, setiap simpul memiliki lebih dari satu fitur target. Sebagai contoh, properti
genre
dari film The Godfather memiliki nilaicrime
danstory
.
-
Node regression — memprediksi properti numerik dari vertex.
Misalnya, film yang diberikan Avengers: Endgame, Neptune ML dapat memprediksi bahwa propertinya
popularity
memiliki nilai5.0
. -
Klasifikasi tepi - memprediksi fitur kategoris dari properti edge.
Ada dua jenis tugas klasifikasi tepi:
Klasifikasi kelas tunggal: Dalam tugas semacam ini, setiap edge memiliki hanya satu fitur target. Misalnya, tepi peringkat antara pengguna dan film mungkin memiliki properti,
liked
, dengan nilai “Ya” atau “Tidak”.Klasifikasi kelas ganda: Dalam tugas semacam ini, setiap edge memiliki lebih dari satu fitur target. Misalnya, rating antara pengguna dan film mungkin memiliki beberapa nilai untuk tag properti seperti “Funny”, “Heartwarming”, “Chilling”, dan sebagainya.
-
Regresi tepi - memprediksi properti numerik dari tepi.
Misalnya, tepi peringkat antara pengguna dan film mungkin memiliki properti numerik,
score
, yang Neptune MLdapat memprediksi nilai yang diberikan pengguna dan film. -
Prediksi link — memprediksi simpul tujuan yang paling mungkin untuk simpul sumber tertentu dan edge keluar, atau simpul sumber yang paling mungkin untuk node tujuan yang diberikan dan edge masuk.
Misalnya, dengan grafik pengetahuan obat-penyakit, diberikan
Aspirin
sebagai simpul sumber, dantreats
sebagai edge keluar, Neptune MLdapat memprediksi simpul tujuan yang paling relevan sebagaiheart disease
fever
,, dan sebagainya.Atau, dengan grafik pengetahuan Wikimedia, diberikan
President-of
sebagai edge atau relasi danUnited-States
sebagai simpul tujuan, Neptune ML dapat memprediksi kepala yang paling relevan sebagaiGeorge Washington
,Abraham Lincoln
,Franklin D. Roosevelt
, dan sebagainya.
catatan
Klasifikasi node dan klasifikasi Edge hanya mendukung nilai string. Itu berarti bahwa nilai-nilai properti numerik seperti0
atau tidak1
didukung, meskipun string setara"0"
dan"1"
. Demikian pula, nilai properti Booleantrue
danfalse
tidak bekerja, tapi"true"
dan"false"
lakukan.
Dengan Neptune ML, Anda dapat menggunakan model machine learning yang termasuk dalam dua kategori umum:
Jenis model machine learning saat ini didukung oleh Neptune ML
Model Graph Neural Network (GNN), – Ini termasuk Relational Graph Convolutional Networks (R-GCN)
. Model GNN berfungsi untuk ketiga-tiga jenis tugas di atas. Model Knowledge-Graph Embedding (KGE) – Ini termasuk model
TransE
,DistMult
, danRotatE
. Mereka hanya sesuai untuk prediksi link.
Model yang ditentukan pengguna - Neptune MLjuga memungkinkan Anda memberikan implementasi model kustom Anda sendiri untuk semua jenis tugas yang tercantum di atas. Anda dapat menggunakan toolkit Neptune MLuntuk