Amazon Neptune MLuntuk machine learning pada grafik

Sering ada informasi berharga dalam set data terhubung yang besar yang sulit untuk diekstrak menggunakan kueri berdasarkan intuisi manusia saja. Teknik machine learning (ML) dapat membantu menemukan korelasi tersembunyi dalam grafik dengan miliaran hubungan. Korelasi ini sangat membantu untuk merekomendasikan produk, memprediksi kelayakan kredit, mengidentifikasi penipuan, dan banyak hal lainnya.

Fitur Neptune ML memungkinkan untuk membangun dan melatih model machine learning yang berguna pada grafik besar dalam hitungan jam, bukan minggu. Untuk mencapai hal ini, Neptune MLmenggunakan teknologi graph neural network (GNN) yang didukung oleh Amazon SageMaker dan Deep Graph Library (DGL) (yang sumbernya terbuka). Grafik neural network adalah bidang yang muncul dalam kecerdasan buatan (lihat, misalnya, Survei Komprehensif pada Graph Neural Network). Untuk tutorial langsung tentang menggunakan GNN dengan DGL, lihat Mempelajari jaringan neural dengan Deep Graph Library.

catatan

Grafik vertex diidentifikasi dalam model Neptune ML sebagai “simpul”. Sebagai contoh, klasifikasi vertex menggunakan model machine learning klasifikasi simpul, dan regresi vertex menggunakan model regresi simpul.

Apa yang bisa dilakukan Neptune ML

Neptune mendukung inferensi transduktif, yang mengembalikan prediksi yang dihitung sebelumnya pada saat pelatihan, berdasarkan data grafik Anda pada waktu itu, dan inferensi induktif, yang mengembalikan menerapkan pemrosesan data dan evaluasi model secara real time, berdasarkan data saat ini. Lihat Perbedaan antara inferensi induktif dan transduktif.

Neptune MLdapat melatih model machine learning untuk mendukung lima kategori inferensi yang berbeda:

Jenis tugas inferensi saat ini didukung oleh Neptune ML

Klasifikasi simpul — memprediksi fitur kategoris dari properti vertex.

Misalnya, film yang diberikan The Shawshank Redemption, Neptune ML dapat memprediksi properti genre-nya sebagai story dari satu set kandidat [story, crime, action, fantasy, drama, family, ...].

Ada dua jenis tugas klasifikasi simpul:
- Klasifikasi kelas tunggal: Dalam tugas semacam ini, setiap simpul memiliki hanya satu fitur target. Sebagai contoh, properti, Place_of_birth dari Alan Turing memiliki nilai UK.
- Klasifikasi kelas ganda: Dalam tugas semacam ini, setiap simpul memiliki lebih dari satu fitur target. Sebagai contoh, properti genre dari film The Godfather memiliki nilai crimedan story.
Node regression — memprediksi properti numerik dari vertex.

Misalnya, film yang diberikan Avengers: Endgame, Neptune ML dapat memprediksi bahwa propertinya popularity memiliki nilai 5.0.
Klasifikasi tepi - memprediksi fitur kategoris dari properti edge.

Ada dua jenis tugas klasifikasi tepi:
- Klasifikasi kelas tunggal: Dalam tugas semacam ini, setiap edge memiliki hanya satu fitur target. Misalnya, tepi peringkat antara pengguna dan film mungkin memiliki properti,liked, dengan nilai “Ya” atau “Tidak”.
- Klasifikasi kelas ganda: Dalam tugas semacam ini, setiap edge memiliki lebih dari satu fitur target. Misalnya, rating antara pengguna dan film mungkin memiliki beberapa nilai untuk tag properti seperti “Funny”, “Heartwarming”, “Chilling”, dan sebagainya.
Regresi tepi - memprediksi properti numerik dari tepi.

Misalnya, tepi peringkat antara pengguna dan film mungkin memiliki properti numerik,score, yang Neptune MLdapat memprediksi nilai yang diberikan pengguna dan film.
Prediksi link — memprediksi simpul tujuan yang paling mungkin untuk simpul sumber tertentu dan edge keluar, atau simpul sumber yang paling mungkin untuk node tujuan yang diberikan dan edge masuk.

Misalnya, dengan grafik pengetahuan obat-penyakit, diberikanAspirin sebagai simpul sumber, dantreats sebagai edge keluar, Neptune MLdapat memprediksi simpul tujuan yang paling relevan sebagaiheart diseasefever,, dan sebagainya.

Atau, dengan grafik pengetahuan Wikimedia, diberikan President-of sebagai edge atau relasi dan United-States sebagai simpul tujuan, Neptune ML dapat memprediksi kepala yang paling relevan sebagai George Washington, Abraham Lincoln, Franklin D. Roosevelt, dan sebagainya.

catatan

Klasifikasi node dan klasifikasi Edge hanya mendukung nilai string. Itu berarti bahwa nilai-nilai properti numerik seperti0 atau tidak1 didukung, meskipun string setara"0" dan"1". Demikian pula, nilai properti Booleantrue danfalse tidak bekerja, tapi"true" dan"false" lakukan.

Dengan Neptune ML, Anda dapat menggunakan model machine learning yang termasuk dalam dua kategori umum:

Jenis model machine learning saat ini didukung oleh Neptune ML

Model Graph Neural Network (GNN), – Ini termasuk Relational Graph Convolutional Networks (R-GCN). Model GNN berfungsi untuk ketiga-tiga jenis tugas di atas.
Model Knowledge-Graph Embedding (KGE) – Ini termasuk model TransE, DistMult, dan RotatE. Mereka hanya sesuai untuk prediksi link.

Model yang ditentukan pengguna - Neptune MLjuga memungkinkan Anda memberikan implementasi model kustom Anda sendiri untuk semua jenis tugas yang tercantum di atas. Anda dapat menggunakan toolkit Neptune MLuntuk mengembangkan dan menguji implementasi model kustom berbasis python sebelum menggunakan API pelatihan Neptune MLdengan model Anda. LihatModel khusus di Neptunus ML detail tentang cara menyusun dan mengatur implementasi Anda sehingga kompatibel dengan infrastruktur pelatihan Neptune ML's.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Contoh fungsi Lambda

Pengaturan Neptune