Lima Algoritma Rekomendasi Tidak Ada Mesin Rekomendasi Yang Utuh Tanpa

Berita4 Dilihat

Untuk membuat rekomendasi, mesin rekomendasi saat ini tidak dapat lagi mengidentifikasi hubungan antara pengguna, ulasan, dan produk tertentu. Untuk benar-benar menonjol di pasar, perusahaan perlu memiliki mesin rekomendasi yang menganalisis data tersebut dari setiap sudut. Mesin rekomendasi yang benar-benar akurat dan dapat beradaptasi membedah hubungan tersebut untuk mengekstrak signifikansi, pengaruh, dan bobotnya.

Hubungan dianalisis menggunakan algoritma rekomendasi. Algoritma rekomendasi yang paling banyak digunakan adalah collaborative filtering – sebuah metode untuk memprediksi (memfilter) minat pengguna secara otomatis dengan mengumpulkan preferensi atau informasi selera dari pengguna lain (berkolaborasi). Premis inti metode penyaringan kolaboratif adalah bahwa jika dua orang memiliki pandangan yang sama tentang subjek tertentu, mereka lebih cenderung memilikinya pada subjek yang berbeda daripada dua orang yang dipilih secara acak.

Sistem rekomendasi pemfilteran kolaboratif untuk prakiraan preferensi produk produk mana yang akan dinikmati pengguna berdasarkan sebagian daftar minat pengguna (ulasan).

alternatif gambar

Tetapi algoritma yang menghubungkan dua atau tiga titik dalam data ini, meskipun sangat populer, tidak lagi cukup baik. Orang-orang menghabiskan banyak waktu dan uang untuk meneliti algoritme yang memperhitungkan data akun yang dapat memengaruhi pembelian seseorang, seperti kebiasaan belanja, tren pasar, konten wishlist, item yang baru dilihat, riwayat pencarian, ulasan, aktivitas platform, dan banyak lagi.

Membuat algoritme untuk mempertimbangkan begitu banyak variabel bukanlah tugas yang mudah. Terutama dalam database relasional di mana membuat koneksi antar tabel mahal bahkan dengan algoritme dasar seperti pemfilteran kolaboratif.

Tetapi data yang disimpan dalam database grafik sudah terhubung dengan relasi yang kaya. Algoritme grafik menggunakan hubungan antar node tersebut untuk mengekstrak informasi kunci dan menggabungkannya untuk memberikan rekomendasi yang tepat. Itulah mengapa sebagian besar algoritme yang digunakan untuk mesin rekomendasi telah dirancang khusus untuk grafik. Dan yang terbaik adalah, algoritme dan implementasinya bebas digunakan, Anda hanya perlu menyesuaikannya dengan kasus penggunaan Anda.

Beberapa algoritma grafik yang digunakan dalam mesin rekomendasi adalah Breadth-first search (BFS), PageRank, Community Detection, dan Link Prediction. Dan jika rekomendasi harus sangat sensitif terhadap waktu, penggunaannya dapat ditingkatkan dengan menggunakan versi dinamis dari algoritme. Algoritme dinamis tidak menghitung ulang semua nilai dalam grafik, dari node pertama hingga terakhir, seperti yang dilakukan oleh algoritme standar. Mereka hanya menghitung ulang nilai-nilai yang dipengaruhi oleh perubahan data, sehingga mempersingkat waktu dan biaya komputasi.

Pencarian luas-pertama (BFS)

Di mesin rekomendasi, pencarian luas pertama dapat digunakan untuk menemukan semua produk yang mungkin diminati pengguna untuk dibeli berdasarkan apa yang dibeli orang lain dengan riwayat belanja serupa.

Algoritmenya sederhana, ia memilih node awal dan mulai menjelajahi semua node yang terhubung dengannya. Kemudian, ia memindahkan titik awal ke salah satu node yang dieksplorasi dan menemukan semua node yang terhubung ke node tersebut. Mengikuti logika itu, ia melewati semua node yang terhubung dalam grafik.

alternatif gambar

Di mesin rekomendasi, algoritme akan dimulai dengan pengguna dan menemukan semua produk yang dibeli pengguna. Dari produk tersebut, akan memperdalam pencarian untuk menemukan semua pengguna lain yang membeli produk yang sama tersebut. Kemudian, ia akan menemukan semua produk lain yang dibeli pengguna yang tidak terhubung ke pengguna target, artinya pengguna tidak membeli produk tersebut.

Setelah pemfilteran lebih lanjut, ditentukan oleh kriteria tertentu yang terlihat dalam riwayat pengguna yang ditargetkan, produk akan disaring. Misalnya, mungkin pengguna tidak pernah membeli atau mencari peralatan apa pun untuk memancing di air tawar, sehingga tidak masuk akal untuk merekomendasikan produk tersebut. Mungkin pengguna lebih suka membeli dalam jumlah banyak atau saat barang sedang diskon. Pada akhirnya, mesin rekomendasi merekomendasikan item yang mungkin paling diminati pengguna untuk dibeli.

Peringkat halaman

Algoritme PageRank dapat digunakan untuk merekomendasikan produk yang paling pas atau sedang tren yang mungkin tertarik untuk dibeli oleh pengguna target. Rekomendasi didasarkan pada berapa kali produk ini dibeli dan seberapa andal pengguna yang membeli atau mengulas produk tersebut. Pengguna yang andal adalah pengguna dengan riwayat belanja dan ulasan yang valid. Pengguna yang tidak dapat diandalkan adalah pelanggan palsu yang membeli untuk meningkatkan jumlah penjualan produk tertentu agar terlihat menarik.

Algoritme menghitung pentingnya setiap node dengan menghitung berapa banyak node yang menunjuk ke sana dan berapa nilai PageRank (PR) mereka. Ada beberapa metode untuk menghitung nilai PR, tetapi yang paling banyak digunakan adalah Iterasi Kekuatan PageRank. Nilai PR dapat berupa nilai antara 0 dan 1, dan ketika semua nilai pada grafik dijumlahkan, hasilnya sama dengan 1. Premis esensial dari algoritme adalah bahwa semakin penting sebuah node, semakin banyak node yang mungkin akan terhubung. dia.

alternatif gambar

Di mesin rekomendasi, algoritme PageRank dapat digunakan untuk mendeteksi produk mana yang sedang tren atau untuk menemukan pengguna yang paling berpengaruh, artinya barang yang mereka beli sering kali dibeli oleh banyak pengguna lain di kemudian hari dan memasukkan hasil tersebut ke dalam rekomendasi akhir. .

Algoritma Deteksi Komunitas

Mesin rekomendasi mendapat manfaat dari menganalisis perilaku pengguna. Menurut perilaku itu, mereka dapat mengidentifikasi pelanggan dengan perilaku serupa dan mengelompokkannya. Setelah grup pengguna dengan kebiasaan membeli yang serupa diidentifikasi, rekomendasi dapat ditargetkan berdasarkan grup tempat mereka berada dan kebiasaan grup tersebut.

Mendeteksi kelompok orang, atau komunitas, dilakukan dengan menggunakan algoritma grafik deteksi komunitas. Komunitas grafik adalah kelompok node di mana node di dalam grup memiliki koneksi yang lebih padat dan lebih baik di antara mereka sendiri daripada dengan node lain dalam grafik.

Algoritma graf deteksi komunitas yang paling banyak digunakan adalah Girvan-Newman, Louivan dan Leiden. Algoritme Girvan-Newman mendeteksi komunitas dengan secara progresif menghapus edge dari jaringan asli. Dalam setiap iterasi, tepi dengan tepi tertinggi di antara, yaitu, jumlah jalur terpendek antara node yang melalui tepi tertentu dihilangkan. Setelah kriteria berhenti terpenuhi, mesin ditinggalkan dengan komunitas yang terhubung dengan erat.

Algoritma Louvian dan Leiden serupa, tetapi algoritma Leiden adalah versi perbaikan dari algoritma Louvian. Kedua algoritme mendeteksi komunitas dengan mencoba mengelompokkan node untuk mengoptimalkan modularitas, yaitu ukuran yang menunjukkan kualitas pembagian grafik ke dalam komunitas.

Pada iterasi pertama, setiap node adalah komunitas untuk dirinya sendiri, dan algoritme mencoba menggabungkan komunitas untuk meningkatkan modularitas. Algoritme berhenti setelah modularitas tidak dapat diperbaiki di antara dua iterasi.

alternatif gambar

Salah satu dari algoritme ini dapat digunakan di mesin rekomendasi untuk mendeteksi komunitas pengguna. Komunitas dapat berupa sekelompok pengguna yang membeli produk dari kategori yang sama atau memiliki kebiasaan membeli atau daftar keinginan yang serupa. Berdasarkan komunitas tempat pelanggan berada, rekomendasi diberikan berdasarkan apa yang dibeli oleh orang lain di komunitas yang sama.

Prediksi Tautan

Jaringan saraf grafik (GNN) telah menjadi sangat populer dalam beberapa tahun terakhir. Setiap node dalam graf dapat memiliki vektor fitur (embedding), yang pada dasarnya menggambarkan node tersebut dengan vektor angka. Dalam jaringan saraf standar, koneksi ke orang lain hanya dianggap sebagai fitur simpul.

Namun, GNN dapat memanfaatkan informasi konten (fitur simpul pengguna dan produk) serta struktur grafik (hubungan pengguna-produk), yang berarti mereka juga mempertimbangkan fitur simpul yang berada di sekitar simpul yang ditargetkan. Untuk mempelajari lebih lanjut tentang GNN, lihat ini artikel dan ini video.

Di mesin rekomendasi, GNN dapat digunakan untuk tugas Prediksi Tautan. Prediksi tautan membutuhkan model GNN untuk memprediksi hubungan antara dua node yang diberikan atau memprediksi node target (atau node sumber) yang diberikan node sumber (atau node target) dan hubungan berlabel.

Itu berarti model GNN dalam mesin rekomendasi akan diberikan dua node sebagai masukan. Satu node mewakili pelanggan, dan node lainnya mewakili produk. Berdasarkan struktur grafik saat ini dan fitur dari kedua node tersebut, model memprediksi apakah pelanggan akan membeli produk ini atau tidak. Semakin aktif pengguna, semakin banyak model GNN yang akan mempelajarinya dan membuat rekomendasi yang lebih baik.

Algoritma dinamis

Data di mesin rekomendasi terus dibuat, dihapus, dan diperbarui. Pada satu titik, musim untuk jenis ikan tertentu dimulai, atau perahu terbukti rusak sehingga menyebabkan kecelakaan dan orang tidak lagi menjelajah, apalagi mempertimbangkan untuk membeli produk dengan merek tersebut. Algoritme rekomendasi perlu memperhitungkan setiap perubahan yang terjadi di pasar untuk membuat rekomendasi terbaik.

Algoritme standar yang kami sebutkan di atas perlu menghitung ulang semua nilai dari simpul pertama pada setiap atau setiap beberapa perubahan. Redundansi ini menciptakan kemacetan karena sangat memakan waktu dan mahal secara komputasi.

Tetapi grafik juga memiliki solusi untuk masalah ini – algoritma grafik dinamis. Dengan memperkenalkan algoritme grafik dinamis, perhitungan tidak lagi dijalankan pada keseluruhan kumpulan data. Mereka menghitung properti grafik dari kumpulan nilai sebelumnya.

Algoritme grafik rekomendasi yang disebutkan di atas, seperti PageRank, Louvain, dan Leiden, memiliki pasangan dinamisnya yang dapat digunakan dalam lingkungan streaming dinamis dengan beberapa perubahan lokal. Dengan versi algoritme yang dinamis, rekomendasi menjadi sensitif terhadap waktu dan beradaptasi dengan perubahan secara instan.

Kesimpulan

Kekuatan di balik setiap mesin rekomendasi adalah algoritme yang digunakan untuk membuat rekomendasi. Algoritme rekomendasi paling kuat dibuat khusus untuk data grafik. Dalam postingan blog ini, kami membahas lebih dari lima algoritme yang menghitung rekomendasi yang tepat dan efektif. Itulah lima alasan lagi mengapa mesin rekomendasi Anda harus menggunakan database grafik, bukan database relasional.

Jika Anda sudah menggunakan database grafik, tetapi beberapa algoritme ini masih baru bagi Anda, sebaiknya gunakan di mesin Anda. Tidak diperlukan mesin rekomendasi untuk rekomendasi itu! Jelas sekali!

Komentar