Βίντεο: "Οι Δίκαιοι" - Albert Camus 2024
Η εκμάθηση μηχανών εξαρτάται πολύ από τα δεδομένα του δείγματος. Αυτό το τμήμα των δεδομένων σας είναι σημαντικό επειδή θέλετε να ανακαλύψετε μια άποψη του κόσμου και, όπως και με όλες τις απόψεις, μπορεί να είναι λανθασμένη, παραμορφωμένη ή απλώς μερική. Γνωρίζετε επίσης ότι χρειάζεστε ένα δείγμα εκτός δείγματος για να ελέγξετε αν η μαθησιακή διαδικασία λειτουργεί. Ωστόσο, οι πτυχές αυτές αποτελούν μόνο ένα μέρος της εικόνας.
Όταν κάνετε έναν αλγόριθμο εκμάθησης μηχανών για τα δεδομένα για να μαντέψετε μια συγκεκριμένη απάντηση, παίρνετε αποτελεσματικά ένα στοίχημα και αυτό το στοίχημα δεν είναι μόνο λόγω του δείγματος που χρησιμοποιείτε για μάθηση. Υπάρχουν περισσότερα. Προς το παρόν, φανταστείτε ότι έχετε ελεύθερα πρόσβαση σε κατάλληλα, αμερόληπτα, σε δείγμα δεδομένα, έτσι τα δεδομένα δεν είναι το πρόβλημα. Αντ 'αυτού πρέπει να επικεντρωθείτε στη μέθοδο εκμάθησης και πρόβλεψης.
Πρώτον, πρέπει να θεωρήσετε ότι στοιχηματίζετε ότι ο αλγόριθμος μπορεί εύλογα να μαντέψει την απάντηση. Δεν μπορείτε πάντοτε να κάνετε αυτήν την υπόθεση, επειδή δεν μπορείτε να βρείτε συγκεκριμένες απαντήσεις, ανεξάρτητα από το τι γνωρίζετε εκ των προτέρων.
Για παράδειγμα, δεν μπορείτε να προσδιορίσετε πλήρως τη συμπεριφορά των ανθρώπων γνωρίζοντας το προηγούμενο ιστορικό και συμπεριφορά τους. Ίσως ένα τυχαίο αποτέλεσμα να εμπλέκεται στη γενετική διαδικασία της συμπεριφοράς μας (το παράλογο μέρος μας, για παράδειγμα), ή ίσως το ζήτημα καταλήγει σε ελεύθερη βούληση (το πρόβλημα είναι επίσης φιλοσοφικό / θρησκευτικό και υπάρχουν πολλές αντιφατικές απόψεις). Κατά συνέπεια, μπορείτε να μαντέψετε μόνο μερικούς τύπους απαντήσεων και για πολλούς άλλους, όπως όταν προσπαθείτε να προβλέψετε τη συμπεριφορά των ανθρώπων, πρέπει να αποδεχθείτε ένα ορισμένο βαθμό αβεβαιότητας, το οποίο, με τύχη, είναι αποδεκτό για τους σκοπούς σας.
Τα μαθηματικά είναι φανταστικά. Μπορεί να περιγράψει ένα μεγάλο μέρος του πραγματικού κόσμου με τη χρήση κάποιου απλού συμβολισμού και είναι ο πυρήνας της μηχανικής μάθησης επειδή οποιοσδήποτε αλγόριθμος μάθησης έχει μια συγκεκριμένη ικανότητα να αντιπροσωπεύει μια μαθηματική διατύπωση.Μερικοί αλγόριθμοι, όπως η γραμμική παλινδρόμηση, χρησιμοποιούν ρητά ένα συγκεκριμένο μαθηματικό σκεύασμα για να αντιπροσωπεύουν πώς μια απάντηση (για παράδειγμα, η τιμή ενός σπιτιού) σχετίζεται με ένα σύνολο προγνωστικών πληροφοριών (όπως πληροφορίες αγοράς, οικία, και ούτω καθεξής).
Ορισμένες συνθέσεις είναι τόσο περίπλοκες και περίπλοκες, παρόλο που είναι δυνατή η εκπροσώπησή τους σε χαρτί, κάτι τέτοιο είναι πολύ δύσκολο από πρακτική άποψη. Ορισμένοι άλλοι περίπλοκοι αλγόριθμοι, όπως τα δέντρα αποφάσεων, δεν έχουν ρητή μαθηματική διατύπωση, αλλά είναι τόσο προσαρμόσιμοι ώστε να μπορούν να οριστούν εύκολα για να προσεγγίσουν ένα μεγάλο εύρος συνθέσεων. Για παράδειγμα, εξετάστε μια απλή και εύκολα εξηγούμενη διατύπωση. Η γραμμική παλινδρόμηση είναι μόνο μια γραμμή σε ένα χώρο συντεταγμένων που δίνεται από την απόκριση και όλους τους προβλεπόμενους. Στο ευκολότερο παράδειγμα, μπορείτε να έχετε μια απάντηση, y και ένα μόνο προγνωστικό, x, με μια διατύπωση
y = β
1 x 1 + β 0 Σε μια απλή κατάσταση απόκρισης που προβλέπεται από ένα μόνο χαρακτηριστικό, ένα τέτοιο μοντέλο είναι τέλειο όταν τα δεδομένα σας ταξινομούνται ως γραμμή. Ωστόσο, τι συμβαίνει αν δεν το κάνει και αντίθετα διαμορφώνεται σαν καμπύλη; Για να εκπροσωπήσετε την κατάσταση, παρατηρήστε μόνο τις ακόλουθες δύο διαστάσεων παραστάσεις.
Παράδειγμα γραμμικού μοντέλου που αγωνίζεται για να αντιστοιχίσει μια λειτουργία καμπύλης.
Όταν τα σημεία μοιάζουν με μια γραμμή ή ένα σύννεφο, εμφανίζεται κάποιο σφάλμα όταν υπολογίζετε ότι το αποτέλεσμα είναι μια ευθεία γραμμή. επομένως η χαρτογράφηση που παρέχεται από την προηγούμενη συνταγή είναι κάπως ασαφής. Ωστόσο, το σφάλμα δεν εμφανίζεται συστηματικά, αλλά μάλλον τυχαία επειδή ορισμένα σημεία είναι πάνω από τη χαρτογραφημένη γραμμή και άλλα είναι κάτω από αυτό. Η κατάσταση με το καμπύλο, διαμορφωμένο σύννεφο των σημείων είναι διαφορετική, επειδή αυτή τη φορά, η γραμμή είναι μερικές φορές ακριβής αλλά σε άλλες φορές είναι συστηματικά λάθος. Μερικές φορές τα σημεία είναι πάντα πάνω από τη γραμμή. μερικές φορές είναι κάτω από αυτό.Λαμβάνοντας υπόψη την απλότητα της χαρτογράφησης της απόκρισης, ο αλγόριθμός σας τείνει να υπερεκτιμάται συστηματικά ή να υποτιμά τους πραγματικούς κανόνες πίσω από τα δεδομένα, που αντιπροσωπεύουν τη μεροληψία του. Η προκατάληψη είναι χαρακτηριστική των απλούστερων αλγορίθμων που δεν μπορούν να εκφράσουν πολύπλοκα μαθηματικά σκευάσματα.