Βίντεο: Recommender Systems 2024
Με βάση μια προσέγγιση που βασίζεται στο χρήστη για συνεργατικό φιλτράρισμα στην ανάλυση πρόβλεψης, το σύστημα μπορεί να υπολογίσει την ομοιότητα μεταξύ ζευγών χρηστών χρησιμοποιώντας τον τύπο ομοιότητας συνημιτότητας, μια τεχνική παρόμοια με την προσέγγιση που βασίζεται σε στοιχεία. Συνήθως, αυτοί οι υπολογισμοί χρειάζονται περισσότερο χρόνο και μπορεί να χρειαστεί να υπολογιστούν συχνότερα από εκείνους που χρησιμοποιούνται στην προσέγγιση που βασίζεται σε στοιχεία. Αυτό συμβαίνει επειδή
-
Θα έχετε περισσότερους χρήστες από τα στοιχεία (ιδανικά ούτως ή άλλως).
-
Θα περιμένατε να αλλάζουν στοιχεία λιγότερο συχνά από τους χρήστες.
-
Με περισσότερους χρήστες και λιγότερη αλλαγή στα προσφερόμενα αντικείμενα, μπορείτε να χρησιμοποιήσετε πολλά ακόμα χαρακτηριστικά από το ιστορικό αγοράς κατά τον υπολογισμό της ομοιότητας χρηστών.
Ένα σύστημα που βασίζεται στο χρήστη μπορεί επίσης να χρησιμοποιήσει αλγορίθμους μηχανικής μάθησης για να ομαδοποιήσει όλους τους χρήστες που έχουν δείξει ότι έχουν τα ίδια γούστα. Το σύστημα χτίζει γειτονιές χρηστών που έχουν παρόμοια προφίλ, πρότυπα αγοράς ή πρότυπα αξιολόγησης. Εάν ένα άτομο σε μια γειτονιά αγοράζει και αρέσει ένα στοιχείο, το σύστημά του μπορεί να συστήσει αυτό το στοιχείο σε όλους τους άλλους της γειτονιάς.
Όπως συμβαίνει και με το συνεργατικό φιλτράρισμα που βασίζεται σε στοιχεία, η προσέγγιση βάσει χρηστών απαιτεί επαρκή δεδομένα για κάθε χρήστη ώστε να είναι αποτελεσματικά. Πριν το σύστημά σας μπορέσει να κάνει συστάσεις, πρέπει να δημιουργήσει ένα προφίλ χρήστη, οπότε απαιτείται επίσης ο χρήστης να δημιουργήσει έναν λογαριασμό και να συνδεθεί (ή να αποθηκεύσει τις πληροφορίες της συνόδου στο πρόγραμμα περιήγησης μέσω cookies) κατά την προβολή ενός ιστότοπου.
Αρχικά το σύστημα μπορεί να ζητήσει από τον χρήστη να δημιουργήσει ένα προφίλ, να επεξεργαστεί το προφίλ θέτοντας ερωτήσεις και στη συνέχεια να βελτιστοποιήσει τις προτάσεις του μετά τη συγκέντρωση των δεδομένων αγοράς του χρήστη.
Το Netflix είναι ένα παράδειγμα γρήγορης δημιουργίας ενός προφίλ για κάθε πελάτη. Εδώ είναι η γενική διαδικασία:
-
Η Netflix προσκαλεί τους πελάτες της να δημιουργήσουν ουρές των ταινιών που θα ήθελαν να παρακολουθήσουν.
-
Οι αναλυόμενες ταινίες αναλύονται για να μάθουν για τις προτιμήσεις του πελάτη σε ταινίες.
-
Το μοντέλο πρόβλεψης συνιστά περισσότερες ταινίες για να παρακολουθεί ο πελάτης, με βάση τις ταινίες που βρίσκονται ήδη στην ουρά.
Ένα δείγμα μήτρας των πελατών και των αντικειμένων που αγόρασε είναι ένα παράδειγμα φίλτρου συνεργασίας με βάση το χρήστη. Για απλότητα, χρησιμοποιήστε έναν κανόνα που δημιουργεί μια γειτονιά χρήστη από χρήστες που αγόρασαν τουλάχιστον δύο κοινά πράγματα.
Στοιχείο 5 | Στοιχείο 6 | A-N1 | X | X | Πελάτης | Στοιχείο 1 |
---|---|---|---|---|---|---|
Item 2 | Item 3 | > X | Β - N1 | |||
X | X | C - N2 | ||||
X | X | D - N2 | ||||
X | X | X > Ε - N1 | X | |||
X | F - N1 | X | ||||
X | X | X | G - N1 | X | ||
X > H - N3 | X | I - N3 | ||||
X | Υπάρχουν τρεις γειτονιές χρήστη: N1, N2 και N3.Κάθε χρήστης στις γειτονιές N1 και N2 έχει αγοράσει τουλάχιστον 2 κοινά στοιχεία με κάποιον άλλο στην ίδια γειτονιά. N3 είναι χρήστες που δεν έχουν ακόμα ικανοποιήσει τα κριτήρια και δεν θα λάβουν συστάσεις μέχρι να αγοράσουν άλλα αντικείμενα για να πληρούν τα κριτήρια. | |||||
Ακολουθεί ένα παράδειγμα για το πώς θα μπορούσατε να χρησιμοποιήσετε αυτό το σύστημα συστημένων: | Offline |
μέσω μιας καμπάνιας μάρκετινγκ ηλεκτρονικού ταχυδρομείου ή εάν ο χρήστης βρίσκεται στον ιστότοπο κατά τη σύνδεσή του. Το σύστημα θα μπορούσε να στείλει διαφημίσεις μάρκετινγκ ή να κάνει συστάσεις στον ιστότοπο ως εξής:
Στοιχείο 3 στον πελάτη Β
Στοιχείο 4 στον πελάτη Γ Στοιχείο 1 στον πελάτη Ε
-
Στοιχείο 3 στον πελάτη F
-
Στοιχείο 2 στον πελάτη G
-
στοιχείο για τους πελάτες Α και D
-
Ιδανικά θα πρέπει να έχετε περισσότερα στοιχεία από έξι. Και πρέπει πάντα να υπάρχουν κάποια στοιχεία στη γειτονιά του πελάτη που ο πελάτης δεν έχει αγοράσει ακόμα.
-
Απροσδιόριστο στοιχείο για τους πελάτες H και I
-
Στην περίπτωση αυτή, δεν υπάρχουν επαρκή δεδομένα για να χρησιμεύσουν ως βάση μιας σύστασης.
Μια πολύ σημαντική διαφορά είναι ότι δεδομένου ότι κάθε πελάτης ανήκει σε μια ομάδα, οι τυχόν μελλοντικές αγορές που κάνει ένα μέλος θα συνιστώνται στα υπόλοιπα μέλη της ομάδας έως ότου επανέλθει το φίλτρο. Έτσι, οι πελάτες Α και Δ θα αρχίσουν να λαμβάνουν συστάσεις πολύ γρήγορα αφού ήδη ανήκουν σε μια γειτονιά και σίγουρα οι άλλοι γείτονες θα αγοράσουν κάτι σύντομα.
-
Για παράδειγμα: αν ο Πελάτης Β αγοράσει το στοιχείο 6, τότε το σύστημά του θα συστήσει το στοιχείο 6 σε όλους σε N1 (Πελάτης Α, Β, Ε, ΣΤ και Γ).
Ο Πελάτης F μπορεί δυνητικά να ανήκει σε κάθε γειτονιά N1 ή N2 ανάλογα με τον τρόπο με τον οποίο υλοποιείται ο συνεργατικός αλγόριθμος φιλτραρίσματος.
Πελάτες H και εγώ παραθέτουμε παραδείγματα του προβλήματος
cold start:
Ο πελάτης δεν έχει παράξει αρκετά δεδομένα για να ομαδοποιηθεί σε γειτονιά χρήστη. Εφόσον δεν υπάρχει προφίλ χρήστη, ένας νέος πελάτης με πολύ μικρό ή καθόλου ιστορικό αγορών - ή που αγοράζει μόνο αντικειμενικά αντικείμενα - θα δημιουργήσει πάντα το πρόβλημα της ψυχρής εκκίνησης στο σύστημα, ανεξάρτητα από το ποια συνεργατική προσέγγιση φιλτραρίσματος χρησιμοποιείται.
Ο Πελάτης I απεικονίζει μια πτυχή του προβλήματος της ψυχρής εκκίνησης που είναι μοναδική για την προσέγγιση που βασίζεται στον χρήστη. Η προσέγγιση που βασίζεται σε στοιχεία θα αρχίσει να βρίσκει άλλα αντικείμενα παρόμοια με τα στοιχεία που αγόρασε ο πελάτης. τότε, εάν άλλοι χρήστες αρχίσουν να αγοράζουν το στοιχείο 6, το σύστημα μπορεί να ξεκινήσει να κάνει προτάσεις. Δεν χρειάζεται να γίνουν περαιτέρω αγορές από τον χρήστη. η προσέγγιση που βασίζεται σε στοιχεία μπορεί να αρχίσει να συνιστά. Ωστόσο, σε ένα σύστημα που βασίζεται σε χρήστες, ο Πελάτης πρέπει να πραγματοποιήσει επιπλέον αγορές για να ανήκει σε γειτονιά χρηστών. το σύστημα δεν μπορεί να κάνει ακόμη συστάσεις. Εντάξει, υπάρχει μια υπόθεση στην εργασία σε αυτά τα απλά παραδείγματα - δηλαδή, ότι ο πελάτης όχι μόνο αγόρασε το στοιχείο αλλά του άρεσε αρκετά για να κάνει παρόμοιες αγορές. Τι γίνεται αν ο πελάτης δεν άρεσε το στοιχείο; Το σύστημα χρειάζεται, τουλάχιστον, να παράγει μεγαλύτερη ακρίβεια στις συστάσεις του.
Μπορείτε να προσθέσετε ένα κριτήριο στο σύστημά σας για να ομαδοποιήσετε άτομα που έδωσαν παρόμοιες αξιολογήσεις με τα στοιχεία που αγόρασαν.Αν το σύστημα εντοπίσει πελάτες που τους αρέσουν και δεν τους αρέσουν τα ίδια στοιχεία, τότε η υπόθεση της υψηλής ακρίβειας είναι έγκυρη. Με άλλα λόγια, υπάρχει μεγάλη πιθανότητα ότι οι πελάτες μοιράζονται τα ίδια γούστα.