Βίντεο: Συνέντευξη Τάσου κωστόπουλου 2024
Η μηχανή φορέων υποστήριξης (SVM) είναι ένας αλγόριθμος πρόβλεψης δεδομένων ανάλυσης δεδομένων δεδομένων σε μία από τις κατηγορίες που έχουν επισημανθεί. Το SVM είναι, στις περισσότερες περιπτώσεις, ένας ταξινομητής δυαδικός . υποθέτει ότι τα εν λόγω δεδομένα περιέχουν δύο πιθανές τιμές-στόχους.
Μια άλλη έκδοση του αλγορίθμου SVM, multimlass SVM, αυξάνει το SVM ώστε να χρησιμοποιείται ως ταξινομητής σε σύνολο δεδομένων που περιέχει περισσότερες από μία κατηγορίες (ομαδοποίηση ή κατηγορία). Το SVM έχει χρησιμοποιηθεί με επιτυχία σε πολλές εφαρμογές όπως η αναγνώριση εικόνων, η ιατρική διάγνωση και η ανάλυση των κειμένων.
Ας υποθέσουμε ότι σχεδιάζετε ένα πρότυπο αναλυτικό μοντέλο που θα αναγνωρίζει αυτόματα και θα προβλέπει το όνομα ενός αντικειμένου σε μια εικόνα. Αυτό είναι ουσιαστικά το πρόβλημα της αναγνώρισης εικόνας - ή, πιο συγκεκριμένα, της αναγνώρισης προσώπου: Θέλετε ο ταξινομητής να αναγνωρίσει το όνομα ενός ατόμου σε μια φωτογραφία.
Λοιπόν, πριν αντιμετωπίσετε αυτό το επίπεδο πολυπλοκότητας, σκεφτείτε μια απλούστερη εκδοχή του ίδιου προβλήματος: Ας υποθέσουμε ότι έχετε φωτογραφίες μεμονωμένων τεμαχίων φρούτων και θα θέλατε ο ταξινομητής σας να προβλέψει τι είδους φρούτα εμφανίζεται στην εικόνα. Ας υποθέσουμε ότι έχετε μόνο δύο είδη φρούτων: μήλα και αχλάδια, ένα ανά εικόνα.
Δεδομένης μιας νέας εικόνας, θα θέλατε να προβλέψετε αν ο καρπός είναι μήλο ή αχλάδι - χωρίς να κοιτάξετε την εικόνα. Θέλετε το SVM να ταξινομεί κάθε εικόνα ως μήλο ή αχλάδι. Όπως συμβαίνει με όλους τους άλλους αλγόριθμους, το πρώτο βήμα είναι η εκπαίδευση του ταξινομητή.
Ας υποθέσουμε ότι έχετε 200 φωτογραφίες διαφορετικών μήλων και 200 φωτογραφίες από αχλάδια. Το βήμα της μάθησης συνίσταται στη σίτιση αυτών των εικόνων στον ταξινομητή, έτσι ώστε να μάθει τι μοιάζει με ένα μήλο και τι μοιάζει με ένα αχλάδι. Πριν βρεθείτε σε αυτό το πρώτο βήμα, πρέπει να μετατρέψετε κάθε εικόνα σε μια μήτρα δεδομένων, χρησιμοποιώντας (για παράδειγμα) το R στατιστικό πακέτο.
Ένας απλός τρόπος για να αναπαραστήσετε μια εικόνα ως αριθμούς σε μια μήτρα είναι να αναζητήσετε γεωμετρικές μορφές μέσα στην εικόνα (όπως κύκλους, γραμμές, τετράγωνα ή ορθογώνια) καθώς και τις θέσεις κάθε στιγμιότυπου κάθε γεωμετρική μορφή. Αυτοί οι αριθμοί μπορούν επίσης να αντιπροσωπεύουν συντεταγμένες αυτών των αντικειμένων μέσα στην εικόνα, όπως απεικονίζονται σε ένα σύστημα συντεταγμένων.
Όπως μπορείτε να φανταστείτε, η απεικόνιση μιας εικόνας ως μήτρας αριθμών δεν είναι ακριβώς ένα απλό έργο. Μια ολόκληρη ξεχωριστή περιοχή έρευνας είναι αφιερωμένη στην απεικόνιση της εικόνας.
Τα παρακάτω δείχνουν πώς μια μηχανή φορέα υποστήριξης μπορεί να προβλέψει την κλάση ενός φρούτου (η επισήμανση είναι μαθηματικά μήλο ή αχλάδι ), με βάση αυτό που ο αλγόριθμος έχει μάθει στο παρελθόν.
Ας υποθέσουμε ότι έχετε μετατρέψει όλες τις εικόνες σε πίνακες δεδομένων. Στη συνέχεια, το μηχάνημα φορέα υποστήριξης λαμβάνει δύο κύριες εισόδους:
-
Προηγούμενα (εκπαιδευτικά) δεδομένα: Αυτό το σύνολο των πινάκων αντιστοιχεί σε προηγούμενες εικόνες μήλων και αχλαδιών.
-
Τα νέα (αόρατα) δεδομένα αποτελούνται από μια εικόνα που έχει μετατραπεί σε ένα πίνακα. Ο σκοπός είναι να προβλέψετε αυτόματα τι υπάρχει στην εικόνα - ένα μήλο ή ένα αχλάδι.
Το διάνυσμα υποστήριξης χρησιμοποιεί μια μαθηματική συνάρτηση, συχνά αποκαλούμενη συνάρτηση πυρήνα , η οποία είναι μια συνάρτηση μαθηματικών που ταιριάζει με τα νέα δεδομένα στην καλύτερη εικόνα από τα δεδομένα εκπαίδευσης, προκειμένου να προβλέψει την ετικέτα της άγνωστης εικόνας ή αχλάδι).
Σε σύγκριση με άλλους ταξινομητές, τα μηχανήματα φορέα υποστήριξης παράγουν ισχυρές, ακριβείς προβλέψεις, επηρεάζονται λιγότερο από τα θορυβώδη δεδομένα και είναι λιγότερο επιρρεπή σε υπερφόρτωση. Λάβετε υπόψη, ωστόσο, ότι οι μηχανές φορέα υποστήριξης είναι οι πλέον κατάλληλες για δυαδική ταξινόμηση - όταν έχετε μόνο δύο κατηγορίες (όπως το μήλο ή το αχλάδι).