Σπίτι Προσωπικά Οικονομικά Πώς να δημιουργήσετε ένα μοντέλο εποπτευόμενης μάθησης με τυχαίο δάσος για προληπτικό Analytics

Πώς να δημιουργήσετε ένα μοντέλο εποπτευόμενης μάθησης με τυχαίο δάσος για προληπτικό Analytics

Πίνακας περιεχομένων:

Βίντεο: What does a Data Analyst do? [2019] 2024

Βίντεο: What does a Data Analyst do? [2019] 2024
Anonim

Το τυχαίο μοντέλο δασών είναι ένα μοντέλο σύνολο να χρησιμοποιηθεί σε προγνωστικές αναλύσεις. παίρνει ένα σύνολο (επιλογή) των δέντρων αποφάσεων για να δημιουργήσει το μοντέλο της. Η ιδέα είναι να ληφθεί ένα τυχαίο δείγμα αδύναμων εκπαιδευομένων (ένα τυχαίο υποσύνολο των δεδομένων εκπαίδευσης) και να τους ψηφίσουν για να επιλέξουν το ισχυρότερο και καλύτερο μοντέλο. Το τυχαίο μοντέλο δασών μπορεί να χρησιμοποιηθεί είτε για ταξινόμηση είτε για παλινδρόμηση. Στο ακόλουθο παράδειγμα, το τυχαίο μοντέλο δασών χρησιμοποιείται για την ταξινόμηση των ειδών Iris.

Φόρτωση των δεδομένων σας

Αυτή η λίστα κωδικών θα φορτώσει το σύνολο δεδομένων ίριδας στη συνεδρία σας: >>>> από το sklearn. data setets load_iris >>>> iris = load_iris ()

Δημιουργία στιγμιότυπου του ταξινομητή

Οι ακόλουθες δύο γραμμές κώδικα δημιουργούν μια εμφάνιση του ταξινομητή. Η πρώτη γραμμή εισάγει την τυχαία βιβλιοθήκη δασών. Η δεύτερη γραμμή δημιουργεί μια εμφάνιση του τυχαίου αλγόριθμου δασών:

>>>> από το sklearn. Η παράμετρος

n_estimators

στον κατασκευαστή είναι μια παράμετρος ρύθμισης που χρησιμοποιείται συνήθως για το τυχαίο μοντέλο δασών (RandomForestClassifier) ​​ >>>> rf = RandomForestClassifier (n_estimators = 15,

random_state = 111). Η τιμή χρησιμοποιείται για την κατασκευή του αριθμού των δένδρων στο δάσος. Είναι γενικά μεταξύ 10 και 100 τοις εκατό του συνόλου δεδομένων, αλλά εξαρτάται από τα δεδομένα που χρησιμοποιείτε. Εδώ, η τιμή είναι 15, δηλαδή 10% των δεδομένων. Αργότερα, θα δείτε ότι η αλλαγή της τιμής παραμέτρου σε 150 (100 τοις εκατό) παράγει τα ίδια αποτελέσματα.

Το n

_estimators χρησιμοποιείται για να συντονιστεί η απόδοση του μοντέλου και η υπερφόρτωση. Όσο μεγαλύτερη είναι η τιμή, τόσο καλύτερη είναι η απόδοση αλλά το κόστος της υπερκατασκευής. Όσο μικρότερη είναι η τιμή, τόσο μεγαλύτερες είναι οι πιθανότητες μη υπερκατασκευής αλλά με κόστος χαμηλότερης απόδοσης. Επίσης, υπάρχει ένα σημείο όπου η αύξηση του αριθμού θα υποβαθμίσει γενικά στη βελτίωση της ακρίβειας και μπορεί να αυξήσει δραματικά την απαιτούμενη υπολογιστική ισχύ. Η παράμετρος είναι προεπιλεγμένη στο 10 εάν παραλείπεται στον κατασκευαστή. Εκτέλεση των δεδομένων εκπαίδευσης

Θα χρειαστεί να διαιρέσετε το σύνολο δεδομένων σε σύνολα εκπαίδευσης και δοκιμής πριν να δημιουργήσετε μια παρουσία του τυχαίου δασικού ταξινομητή. Ο παρακάτω κώδικας θα ολοκληρώσει αυτή την εργασία: >>>> από την εισαγωγή sklearn cross_validation >>>> X_train, X_test, y_train, y_test =

cross_validation. Τρέχουσα_συχνότητα (iris, ίριδας στόχος, test_size = 0.10, random_state = 111) >>>> rf = rf. fit (X_train, y_train) Η Γραμμή 1 εισάγει τη βιβλιοθήκη που σας επιτρέπει να διαιρέσετε το σύνολο δεδομένων σε δύο μέρη.

Η γραμμή 2 καλεί τη λειτουργία από τη βιβλιοθήκη που διαιρεί το σύνολο δεδομένων σε δύο μέρη και ορίζει τα τώρα χωρισμένα σύνολα δεδομένων σε δύο ζεύγη μεταβλητών.

Η γραμμή 3 παίρνει την περίπτωση του τυχαίου δασικού ταξινομητή που μόλις δημιουργήσατε και στη συνέχεια καλεί τη μέθοδο προσαρμογής για να εκπαιδεύσει το μοντέλο με το σύνολο δεδομένων κατάρτισης.

Εκτέλεση των δεδομένων ελέγχου

Στον ακόλουθο κώδικα, η πρώτη γραμμή τροφοδοτεί το σύνολο δεδομένων δοκιμής στο μοντέλο και στη συνέχεια η τρίτη γραμμή εμφανίζει την έξοδο: >>>> predicted = rf. (0, 2, 2, 2, 0, 2, 2, 1, 2, 0, 1, 2, 2)) > Αξιολόγηση του μοντέλου

Μπορείτε να παραπέμψετε την έξοδο από την πρόβλεψη με τη συστοιχία

y_test

. Ως αποτέλεσμα, μπορείτε να δείτε ότι προέβλεψε λανθασμένα δύο σημεία δεδομένων δοκιμής. Έτσι, η ακρίβεια του τυχαίου μοντέλου δασών ήταν 86,6%.

  • Εδώ είναι ο κώδικας: >>>> από τις μετρήσεις εισαγωγής sklearn >>>> προβλεπόμενος
  • πίνακας ([0, 0, 2, 2, 2, 1, 2, 2, 2, 1, 2, 2, 2]) >>>> y_test
  • 2, 2]) >>>> μετρήσεις. accuracy_score (y_test, προβλεπόμενο)

0. (True, True, True, True, False, True, True,

True, True, True, True, True, False, True, True], dtype = bool)

Πώς παράγει το τυχαίο μοντέλο δασών εάν αλλάξετε την παράμετρο

n_estimators

σε 150; Φαίνεται ότι δεν θα κάνει τη διαφορά για αυτό το μικρό σύνολο δεδομένων. Παράγει το ίδιο αποτέλεσμα: >>>> rf = RandomForestClassifier (n_estimators = 150,

random_state = 111) >>>> rf = rf. προσαρμογή (X_train, y_train) >>>> προβλεπόμενη = rf. (0, 2, 2, 2, 0, 2, 2, 1, 2, 0, 1, 2, 2)) >

Πώς να δημιουργήσετε ένα μοντέλο εποπτευόμενης μάθησης με τυχαίο δάσος για προληπτικό Analytics

Η επιλογή των συντακτών

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Οι πιο βασικές ηλεκτρονικές χρήσεις ενός ενισχυτή Op είναι ως ενισχυτής. Εάν συνδέσετε μια πηγή εισόδου σε έναν από τους ακροδέκτες εισόδου και γειώσετε τον άλλο ακροδέκτη εισόδου, εμφανίζεται μια ενισχυμένη έκδοση του σήματος εισόδου στο εξωτερικό τερματικό. Μια σημαντική ιδέα στα κυκλώματα op-amp ...

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Για την οικοδόμηση ενός πραγματικού ηλεκτρονικού κυκλώματος χρησιμοποιώντας Op-amp, φυσικά, θα πρέπει να χρησιμοποιήσετε ένα πραγματικό ενισχυτή op. Ευτυχώς, τα ενσωματωμένα ολοκληρωμένα κυκλώματα (IC) είναι άφθονα και σχεδόν όλα τα καταστήματα που πωλούν ηλεκτρονικά εξαρτήματα πωλούν διάφορους τύπους φθηνών IC-ενισχυτών. Το πιο δημοφιλές op-amp IC είναι το LM741, το οποίο έρχεται ...

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

. Η ακριβής κυματομορφή που παράγεται εξαρτάται από τον τύπο του κυκλώματος που χρησιμοποιείται για τη δημιουργία του ταλαντωτή. Ένα από τα συνηθέστερα χρησιμοποιούμενα κυκλώματα ταλαντωτών είναι κατασκευασμένο από ένα ζεύγος τρανζίστορ που είναι εφοδιασμένα για να εναλλάσσονται και να σβήνουν εναλλάξ. Αυτός ο τύπος κυκλώματος είναι ...

Η επιλογή των συντακτών

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Η ασήμαντη εκπαίδευση είναι ένα σημαντικό βήμα στην ανάπτυξη των παιδιών. Ως γονέας, θα πρέπει να αναγνωρίσετε τα σημάδια ότι το παιδί σας είναι έτοιμο για την ομιλία της τουαλέτας, να ξεκινήσει μια διαδικασία ασήμαντης κατάρτισης, να συνεχίσει τη διαδικασία και να αναγνωρίσει πότε το παιδί σας είναι σχεδόν εκεί. Κατά τη διάρκεια της διαδρομής, πρέπει να σιγουρευτείτε ότι το παιδί σας ξέρει ...

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Παιδιά, ανάλογα με την αναπηρία. Μπορεί να χρειαστεί να παρέχετε στηρίγματα υψηλής τεχνολογίας που διευκολύνουν την κίνηση από τον περιπατητή ή την αναπηρική καρέκλα στην τουαλέτα (δείτε την ενότητα "Εργασία με ειδικό εργαλείο" σε αυτό το άρθρο.) Από την άλλη πλευρά, το παιδί σας μπορεί να ...

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Την ημέρα που κάθε γονιός επιθυμεί, αλλά δεν μπορείτε να βιάσετε τη διαδικασία. Περιμένετε τα σημάδια ότι το παιδί σας είναι έτοιμο να αντιμετωπίσει αυτή τη μεγάλη πρόκληση. Παρακολουθήστε τα σημεία στην παρακάτω λίστα. οι πρώτες πέντε είναι απολύτως απαραίτητες: μένει ξηρό τουλάχιστον δύο ώρες παίρνει Bummed από υγρό ή ...

Η επιλογή των συντακτών

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Αναδυόμενο πεδίο της ιατρικής μυαλού-σώματος υπενθυμίζει στους ανθρώπους - και γιόγκι και σοφοί έχουν πει για χιλιετίες - το σώμα σας, το μυαλό σας και η καρδιά σας αποτελούν ένα ενιαίο και αδιάσπαστο σύνολο. Όταν οι σκέψεις σας συνεχίζουν να σφύζουν από την ανησυχία σας, το σώμα σας αποκρίνεται με τη σύσφιξη και την τάνυση, ειδικά σε ορισμένες σημαντικές θέσεις ...

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πόνος είναι κάτι που θα αντιμετωπίσει κάποιος σε κάποιο σημείο . Η προσοχή μπορεί να σας βοηθήσει να προσεγγίσετε πόνο με υγιεινό τρόπο. Ο οξύς πόνος είναι ένας αιχμηρός πόνος που διαρκεί για μικρό χρονικό διάστημα, μερικές φορές ορίζεται ως λιγότερο από 12 εβδομάδες. Η ιατρική είναι αρκετά καλή για τη θεραπεία του οξέος πόνου. Ο χρόνιος πόνος είναι ο πόνος που διαρκεί ...

Βελτίωση των σχέσεών σας - ανδρείκεS

Βελτίωση των σχέσεών σας - ανδρείκεS

Σχέσεις - είτε με την οικογένεια, τους φίλους ή τους εραστές; Και δεν έχει σημασία πόσο χαρούμενος και ευχαριστημένος είστε με τις σημαντικές σχέσεις στη ζωή σας, υπάρχει πάντα περιθώριο βελτίωσης. Οι σχέσεις, όπως όλες οι διεργασίες, επίσης καταλήγουν και ρέουν και σας παρουσιάζουν προκλήσεις. Εδώ είναι μερικές εξαιρετικές τεχνικές για να σας βοηθήσουμε ...