Σπίτι Προσωπικά Οικονομικά Πώς να εξηγείτε τα αποτελέσματα μιας ταξινόμησης R Προγνωστικό μοντέλο Analytics - dummies

Πώς να εξηγείτε τα αποτελέσματα μιας ταξινόμησης R Προγνωστικό μοντέλο Analytics - dummies

Βίντεο: Statistical Programming with R by Connor Harris 2024

Βίντεο: Statistical Programming with R by Connor Harris 2024
Anonim

είναι η ταξινόμηση νέων δεδομένων, προβλέποντας σε ποια κλάση ανήκει ένα στοιχείο στόχου δεδομένων, δεδομένου ενός συνόλου ανεξάρτητων μεταβλητών. Μπορείτε, για παράδειγμα, να ταξινομήσετε έναν πελάτη ανά τύπο - για παράδειγμα, ως πελάτης υψηλής αξίας, ένας τακτικός πελάτης ή ένας πελάτης που είναι έτοιμος να μεταβεί σε έναν ανταγωνιστή - χρησιμοποιώντας ένα δέντρο αποφάσεων.

Για να δείτε μερικές χρήσιμες πληροφορίες σχετικά με το μοντέλο ταξινόμησης R, πληκτρολογήστε τον ακόλουθο κώδικα:

>> περίληψη (μοντέλο) Λειτουργία κλάσης Μήκος 1 BinaryTree S4
Η στήλη Κλάση σας λέει ότι έχετε δημιουργήσει ένα δέντρο απόφασης. Για να δείτε πώς προσδιορίζονται τα διαχωρίσματα, μπορείτε απλά να πληκτρολογήσετε το όνομα της μεταβλητής στην οποία έχετε αντιστοιχίσει το μοντέλο, σε αυτό το μοντέλο, όπως παρακάτω:

μοντέλο Υποκατάστατο δέντρο συμπερασμάτων με 6 τερματικούς κόμβους Απόκριση: inputType Inputs: περιοχή, περίμετρος, συμπαγής, μήκος, πλάτος, ασυμμετρία, μήκος2 Αριθμός παρατηρήσεων: 147 1) περιοχή <= 16. 2; κριτήριο = 1, στατιστικό = 123. 423 2) περιοχή <= 13. 37; κριτήριο = 1, στατιστική = 63. 549 3) μήκος 2 4. 914 5) * βάρη = 45 2) περιοχή> 13. 37 6) μήκος 2 5. 396 8) * βάρος = 8 1) 5. 877 11) * weights = 40

Ακόμη καλύτερα, μπορείτε να απεικονίσετε το μοντέλο δημιουργώντας μια γραφική παράσταση του δέντρου αποφάσεων με αυτόν τον κώδικα:> plot (model)

Αυτή είναι μια γραφική παράσταση ενός δέντρου αποφάσεων. Μπορείτε να δείτε ότι η συνολική μορφή μιμείται αυτή ενός πραγματικού δέντρου. Αποτελείται από

κόμβους (τους κύκλους και τα ορθογώνια) και τις συνδέσεις ή ακμές (τις γραμμές σύνδεσης). Ο πρώτος κόμβος (που αρχίζει από την κορυφή) ονομάζεται

κόμβος ρίζας και οι κόμβοι στο κάτω μέρος του δέντρου (ορθογώνια) ονομάζονται τερματικοί κόμβοι . Υπάρχουν πέντε κόμβοι αποφάσεων και έξι τερματικοί κόμβοι.

Σε κάθε κόμβο, το μοντέλο λαμβάνει μια απόφαση με βάση τα κριτήρια στον κύκλο και τους συνδέσμους και επιλέγει έναν τρόπο να πάει. Όταν το μοντέλο φτάσει σε έναν τερματικό κόμβο, καταλήγει σε ετυμηγορία ή τελική απόφαση. Στη συγκεκριμένη περίπτωση, χρησιμοποιούνται δύο ιδιότητες, το και το, για να αποφασιστεί αν ένας συγκεκριμένος τύπος σπόρου είναι στην κλάση 1, 2 ή 3.

Για παράδειγμα, λάβετε την παρατήρηση # 2 από το σύνολο δεδομένων. Έχει ένα 4.956 και ένα 14. 88. Μπορείτε να χρησιμοποιήσετε το δέντρο που μόλις χτίστηκε για να αποφασίσετε ποιος συγκεκριμένος τύπος σπόρου αυτής της παρατήρησης ανήκει. Ακολουθεί η ακολουθία των βημάτων:

Ξεκινήστε στον κόμβο ρίζας, ο οποίος είναι ο κόμβος 1 (ο αριθμός εμφανίζεται στο μικρό τετράγωνο στο πάνω μέρος του κύκλου). Αποφασίστε με βάση το χαρακτηριστικό: Είναι η παρατήρηση # 2 μικρότερη ή ίση με (υποδηλώνεται με <=) 16.2; η απάντηση είναι ναι, οπότε μετακινήστε τη διαδρομή προς τον κόμβο 2.

  1. Στο κόμβο 2, το μοντέλο ρωτάει: Είναι η περιοχή 13. 37; Η απάντηση είναι ναι, οπότε μετακινηθείτε κατά μήκος της διαδρομής στον κόμβο 6. Στον κόμβο αυτό το μοντέλο ρωτάει: Είναι το μήκος2 <= 5. 396; είναι και μετακινείτε στον τερματικό κόμβο 7 και η ετυμηγορία είναι ότι η παρατήρηση # 2 είναι τύπου σπόρου 1. Και είναι στην πραγματικότητα ο σπόρος τύπου 1.

  2. Το μοντέλο κάνει αυτή τη διαδικασία για όλες τις άλλες παρατηρήσεις για να προβλέψει τάξεις.

    Για να μάθετε αν έχετε εκπαιδεύσει ένα καλό μοντέλο, ελέγξτε το κατά των δεδομένων εκπαίδευσης. Μπορείτε να δείτε τα αποτελέσματα σε έναν πίνακα με τον ακόλουθο κώδικα: >> πίνακας (πρόβλεψη (μοντέλο), trainSet $ ​​seedType) 1 2 3 1 45 4 3 2 3 47 0 3 1 0 44

  3. Τα αποτελέσματα δείχνουν ότι το σφάλμα (ή ο βαθμός εσφαλμένης ταξινόμησης) είναι 11 από τα 147 ή το 7,4%.

    Με τα αποτελέσματα να υπολογίζονται, το επόμενο βήμα είναι να διαβάσετε τον πίνακα.
    

    Οι σωστές προβλέψεις είναι εκείνες που δείχνουν τον ίδιο αριθμό στήλης και γραμμής. Αυτά τα αποτελέσματα εμφανίζονται ως μια διαγώνια γραμμή από πάνω προς τα αριστερά προς τα κάτω. για παράδειγμα, [1, 1], [2, 2], [3, 3] είναι ο αριθμός των σωστών προβλέψεων για αυτήν την κλάση.

  4. Έτσι, για τον σπόρο τύπου 1, το μοντέλο προέβλεψε σωστά 45 φορές, ενώ εσφαλμένα ταξινόμησε τους σπόρους 7 φορές (4 φορές ως σπόροι τύπου 2 και 3 φορές ως τύπος 3). Για τον τύπο σπόρου 2, το μοντέλο προέβλεψε σωστά 47 φορές, ενώ το ταξινόμησε εσφαλμένα 3 φορές. Για τον τύπο σπόρου 3, το μοντέλο το προέβλεψε σωστά 44 φορές, ενώ το ταξινόμησε εσφαλμένα μόνο μία φορά.

    Αυτό δείχνει ότι αυτό είναι ένα καλό μοντέλο. Τώρα το αξιολογείτε με τα δεδομένα δοκιμών. Εδώ είναι ο κώδικας που χρησιμοποιεί τα δεδομένα δοκιμών για την πρόβλεψη και αποθήκευση του σε μια μεταβλητή (testPrediction) για μεταγενέστερη χρήση: >> testPrediction <- πρόβλεψη (μοντέλο, newdata = testSet)

    ελέγξτε τα δεδομένα, δείτε το σε έναν πίνακα και υπολογίστε το σφάλμα, για το οποίο ο κώδικας μοιάζει με αυτόν τον τύπο: >> table (testPrediction, testSet $ ​​seedType) testPrediction 1 2 3 1 23 2 1 2 1 19 0 3 1 0 17 < Τα αποτελέσματα δείχνουν ότι το σφάλμα είναι 5 από τα 64, ή το 7,7%. Αυτό συμβαδίζει με τα δεδομένα εκπαίδευσης.

Πώς να εξηγείτε τα αποτελέσματα μιας ταξινόμησης R Προγνωστικό μοντέλο Analytics - dummies

Η επιλογή των συντακτών

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Οι πιο βασικές ηλεκτρονικές χρήσεις ενός ενισχυτή Op είναι ως ενισχυτής. Εάν συνδέσετε μια πηγή εισόδου σε έναν από τους ακροδέκτες εισόδου και γειώσετε τον άλλο ακροδέκτη εισόδου, εμφανίζεται μια ενισχυμένη έκδοση του σήματος εισόδου στο εξωτερικό τερματικό. Μια σημαντική ιδέα στα κυκλώματα op-amp ...

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Για την οικοδόμηση ενός πραγματικού ηλεκτρονικού κυκλώματος χρησιμοποιώντας Op-amp, φυσικά, θα πρέπει να χρησιμοποιήσετε ένα πραγματικό ενισχυτή op. Ευτυχώς, τα ενσωματωμένα ολοκληρωμένα κυκλώματα (IC) είναι άφθονα και σχεδόν όλα τα καταστήματα που πωλούν ηλεκτρονικά εξαρτήματα πωλούν διάφορους τύπους φθηνών IC-ενισχυτών. Το πιο δημοφιλές op-amp IC είναι το LM741, το οποίο έρχεται ...

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

. Η ακριβής κυματομορφή που παράγεται εξαρτάται από τον τύπο του κυκλώματος που χρησιμοποιείται για τη δημιουργία του ταλαντωτή. Ένα από τα συνηθέστερα χρησιμοποιούμενα κυκλώματα ταλαντωτών είναι κατασκευασμένο από ένα ζεύγος τρανζίστορ που είναι εφοδιασμένα για να εναλλάσσονται και να σβήνουν εναλλάξ. Αυτός ο τύπος κυκλώματος είναι ...

Η επιλογή των συντακτών

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Η ασήμαντη εκπαίδευση είναι ένα σημαντικό βήμα στην ανάπτυξη των παιδιών. Ως γονέας, θα πρέπει να αναγνωρίσετε τα σημάδια ότι το παιδί σας είναι έτοιμο για την ομιλία της τουαλέτας, να ξεκινήσει μια διαδικασία ασήμαντης κατάρτισης, να συνεχίσει τη διαδικασία και να αναγνωρίσει πότε το παιδί σας είναι σχεδόν εκεί. Κατά τη διάρκεια της διαδρομής, πρέπει να σιγουρευτείτε ότι το παιδί σας ξέρει ...

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Παιδιά, ανάλογα με την αναπηρία. Μπορεί να χρειαστεί να παρέχετε στηρίγματα υψηλής τεχνολογίας που διευκολύνουν την κίνηση από τον περιπατητή ή την αναπηρική καρέκλα στην τουαλέτα (δείτε την ενότητα "Εργασία με ειδικό εργαλείο" σε αυτό το άρθρο.) Από την άλλη πλευρά, το παιδί σας μπορεί να ...

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Την ημέρα που κάθε γονιός επιθυμεί, αλλά δεν μπορείτε να βιάσετε τη διαδικασία. Περιμένετε τα σημάδια ότι το παιδί σας είναι έτοιμο να αντιμετωπίσει αυτή τη μεγάλη πρόκληση. Παρακολουθήστε τα σημεία στην παρακάτω λίστα. οι πρώτες πέντε είναι απολύτως απαραίτητες: μένει ξηρό τουλάχιστον δύο ώρες παίρνει Bummed από υγρό ή ...

Η επιλογή των συντακτών

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Αναδυόμενο πεδίο της ιατρικής μυαλού-σώματος υπενθυμίζει στους ανθρώπους - και γιόγκι και σοφοί έχουν πει για χιλιετίες - το σώμα σας, το μυαλό σας και η καρδιά σας αποτελούν ένα ενιαίο και αδιάσπαστο σύνολο. Όταν οι σκέψεις σας συνεχίζουν να σφύζουν από την ανησυχία σας, το σώμα σας αποκρίνεται με τη σύσφιξη και την τάνυση, ειδικά σε ορισμένες σημαντικές θέσεις ...

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πόνος είναι κάτι που θα αντιμετωπίσει κάποιος σε κάποιο σημείο . Η προσοχή μπορεί να σας βοηθήσει να προσεγγίσετε πόνο με υγιεινό τρόπο. Ο οξύς πόνος είναι ένας αιχμηρός πόνος που διαρκεί για μικρό χρονικό διάστημα, μερικές φορές ορίζεται ως λιγότερο από 12 εβδομάδες. Η ιατρική είναι αρκετά καλή για τη θεραπεία του οξέος πόνου. Ο χρόνιος πόνος είναι ο πόνος που διαρκεί ...

Βελτίωση των σχέσεών σας - ανδρείκεS

Βελτίωση των σχέσεών σας - ανδρείκεS

Σχέσεις - είτε με την οικογένεια, τους φίλους ή τους εραστές; Και δεν έχει σημασία πόσο χαρούμενος και ευχαριστημένος είστε με τις σημαντικές σχέσεις στη ζωή σας, υπάρχει πάντα περιθώριο βελτίωσης. Οι σχέσεις, όπως όλες οι διεργασίες, επίσης καταλήγουν και ρέουν και σας παρουσιάζουν προκλήσεις. Εδώ είναι μερικές εξαιρετικές τεχνικές για να σας βοηθήσουμε ...