Σπίτι Προσωπικά Οικονομικά Πώς να εκτελείτε δεδομένα εκπαίδευσης σε ένα μοντέλο εκπαίδευσης μάθησης SVM - dummies

Πώς να εκτελείτε δεδομένα εκπαίδευσης σε ένα μοντέλο εκπαίδευσης μάθησης SVM - dummies

Βίντεο: Savings and Loan Crisis: Explained, Summary, Timeline, Bailout, Finance, Cost, History 2024

Βίντεο: Savings and Loan Crisis: Explained, Summary, Timeline, Bailout, Finance, Cost, History 2024
Anonim

Για να μπορέσετε να τροφοδοτήσετε τον ταξινομητή SVM (SVM) με τα δεδομένα που φορτώθηκαν για προγνωστική ανάλυση, πρέπει να διαιρέσετε το πλήρες σύνολο δεδομένων σε ένα σετ εκπαίδευσης και δοκιμή.

Ευτυχώς, το scikit-learn έχει υλοποιήσει μια λειτουργία που θα σας βοηθήσει να διαιρέσετε εύκολα το πλήρες σύνολο δεδομένων. Η συνάρτηση train_test_split λαμβάνει ως είσοδο ένα ενιαίο σύνολο δεδομένων και μια ποσοστιαία τιμή. Η ποσοστιαία τιμή χρησιμοποιείται για τον προσδιορισμό του μεγέθους του σετ δοκιμών. Η συνάρτηση επιστρέφει δύο σύνολα δεδομένων: το σύνολο δεδομένων δοκιμής (με το καθορισμένο μέγεθος) και το σύνολο δεδομένων κατάρτισης (το οποίο χρησιμοποιεί τα υπόλοιπα δεδομένα).

Συνήθως, μπορεί κανείς να πάρει περίπου το 70-80 τοις εκατό των δεδομένων για να χρησιμοποιήσει ως σύνολο εκπαίδευσης και να χρησιμοποιήσει τα υπόλοιπα δεδομένα ως σύνολο δοκιμών. Αλλά το σύνολο δεδομένων Iris είναι πολύ μικρό (μόνο 150 περιπτώσεις), έτσι μπορείτε να πάρετε το 90 τοις εκατό από αυτό για να εκπαιδεύσετε το μοντέλο και να χρησιμοποιήσετε τα άλλα 10 τοις εκατό ως δεδομένα δοκιμών για να δείτε πώς το πρότυπο πρότυπο σας θα εκτελέσει.

Πληκτρολογήστε τον παρακάτω κώδικα για να διαιρέσετε το σύνολο δεδομένων σας: >>>> από την εισαγωγή sklearn cross_validation >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris data, iris target, test_size = 0.10, random_state = 111)

Η πρώτη γραμμή εισάγει βιβλιοθήκη διασταυρωμένης επικύρωσης στην συνεδρία σας. Η δεύτερη γραμμή δημιουργεί το σύνολο δοκιμών από το 10% του δείγματος.

Το x_train θα περιέχει 135 παρατηρήσεις και τα χαρακτηριστικά του.

Το y_train θα περιέχει 135 ετικέτες στην ίδια σειρά με τις 135 παρατηρήσεις.

Το x_test θα περιέχει 15 (ή 10 τοις εκατό) παρατηρήσεις και τα χαρακτηριστικά του.

Το y_test θα περιέχει 15 ετικέτες στην ίδια σειρά με τις 15 παρατηρήσεις.

Ο παρακάτω κώδικας επαληθεύει ότι η διάσπαση είναι αυτό που περιμένατε:

>>>> X_train. σχήμα (135, 4) >>> y_train. σχήμα (135,) >>> X_test. σχήμα (15, 4) >>> y_test. σχήμα (15,)

Μπορείτε να δείτε από την έξοδο ότι υπάρχουν 135 παρατηρήσεις με 4 χαρακτηριστικά και 135 ετικέτες στο σετ εκπαίδευσης. Το σύνολο δοκιμών έχει 15 παρατηρήσεις με 4 χαρακτηριστικά και 15 ετικέτες.
Πολλοί αρχάριοι στον τομέα των προγνωστικών αναλύσεων ξεχνούν να χωρίσουν τα σύνολα δεδομένων - κάτι που εισάγει ένα σοβαρό σχεδιαστικό ελάττωμα στο έργο. Εάν οι πλήρεις 150 περιπτώσεις φορτώθηκαν στο μηχάνημα ως δεδομένα εκπαίδευσης, αυτό δεν θα άφηνε κανένα αόρατο δεδομένο για τη δοκιμή του μοντέλου. Στη συνέχεια, θα πρέπει να καταφύγετε σε επαναχρησιμοποίηση ορισμένων περιπτώσεων εκπαίδευσης για να δοκιμάσετε το μοντέλο πρόβλεψης.

Θα δείτε ότι σε μια τέτοια κατάσταση, το μοντέλο πάντα προβλέπει τη σωστή κατηγορία - επειδή χρησιμοποιείτε τα ίδια ακριβή δεδομένα που χρησιμοποιήσατε για την εκπαίδευση του μοντέλου.Το μοντέλο έχει ήδη δει αυτό το πρότυπο πριν? δεν θα έχει κανένα πρόβλημα απλώς να επαναλαμβάνει αυτό που βλέπει. Ένα πρότυπο πρότυπο εργασίας πρέπει να κάνει προβλέψεις για δεδομένα που δεν έχει δει ακόμη.

Όταν έχετε μια παρουσία ενός ταξινομητή SVM, ενός συνόλου δεδομένων εκπαίδευσης και ενός συνόλου δεδομένων δοκιμής, είστε έτοιμοι να εκπαιδεύσετε το μοντέλο με τα δεδομένα εκπαίδευσης. Η πληκτρολόγηση του ακόλουθου κώδικα στον διερμηνέα θα κάνει ακριβώς αυτό: >>>> svmClassifier. fit (X_train, y_train)

Αυτή η γραμμή κώδικα δημιουργεί ένα μοντέλο εργασίας για την πραγματοποίηση προβλέψεων. Συγκεκριμένα, ένα μοντέλο πρόβλεψης που θα προβλέψει ποια κλάση του Iris ανήκει σε ένα νέο μη ετικετοποιημένο σύνολο δεδομένων. Η εντολή svmClassifier θα έχει πολλές μεθόδους που μπορείτε να καλέσετε για να κάνετε διάφορα πράγματα.

Για παράδειγμα, μετά την κλήση της μεθόδου προσαρμογής, η πιο χρήσιμη μέθοδος κλήσης είναι η μέθοδος πρόβλεψης. Αυτή είναι η μέθοδος στην οποία θα τροφοδοτήσετε νέα δεδομένα. σε αντάλλαγμα, προβλέπει το αποτέλεσμα.

Πώς να εκτελείτε δεδομένα εκπαίδευσης σε ένα μοντέλο εκπαίδευσης μάθησης SVM - dummies

Η επιλογή των συντακτών

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Οι πιο βασικές ηλεκτρονικές χρήσεις ενός ενισχυτή Op είναι ως ενισχυτής. Εάν συνδέσετε μια πηγή εισόδου σε έναν από τους ακροδέκτες εισόδου και γειώσετε τον άλλο ακροδέκτη εισόδου, εμφανίζεται μια ενισχυμένη έκδοση του σήματος εισόδου στο εξωτερικό τερματικό. Μια σημαντική ιδέα στα κυκλώματα op-amp ...

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Για την οικοδόμηση ενός πραγματικού ηλεκτρονικού κυκλώματος χρησιμοποιώντας Op-amp, φυσικά, θα πρέπει να χρησιμοποιήσετε ένα πραγματικό ενισχυτή op. Ευτυχώς, τα ενσωματωμένα ολοκληρωμένα κυκλώματα (IC) είναι άφθονα και σχεδόν όλα τα καταστήματα που πωλούν ηλεκτρονικά εξαρτήματα πωλούν διάφορους τύπους φθηνών IC-ενισχυτών. Το πιο δημοφιλές op-amp IC είναι το LM741, το οποίο έρχεται ...

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

. Η ακριβής κυματομορφή που παράγεται εξαρτάται από τον τύπο του κυκλώματος που χρησιμοποιείται για τη δημιουργία του ταλαντωτή. Ένα από τα συνηθέστερα χρησιμοποιούμενα κυκλώματα ταλαντωτών είναι κατασκευασμένο από ένα ζεύγος τρανζίστορ που είναι εφοδιασμένα για να εναλλάσσονται και να σβήνουν εναλλάξ. Αυτός ο τύπος κυκλώματος είναι ...

Η επιλογή των συντακτών

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Η ασήμαντη εκπαίδευση είναι ένα σημαντικό βήμα στην ανάπτυξη των παιδιών. Ως γονέας, θα πρέπει να αναγνωρίσετε τα σημάδια ότι το παιδί σας είναι έτοιμο για την ομιλία της τουαλέτας, να ξεκινήσει μια διαδικασία ασήμαντης κατάρτισης, να συνεχίσει τη διαδικασία και να αναγνωρίσει πότε το παιδί σας είναι σχεδόν εκεί. Κατά τη διάρκεια της διαδρομής, πρέπει να σιγουρευτείτε ότι το παιδί σας ξέρει ...

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Παιδιά, ανάλογα με την αναπηρία. Μπορεί να χρειαστεί να παρέχετε στηρίγματα υψηλής τεχνολογίας που διευκολύνουν την κίνηση από τον περιπατητή ή την αναπηρική καρέκλα στην τουαλέτα (δείτε την ενότητα "Εργασία με ειδικό εργαλείο" σε αυτό το άρθρο.) Από την άλλη πλευρά, το παιδί σας μπορεί να ...

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Την ημέρα που κάθε γονιός επιθυμεί, αλλά δεν μπορείτε να βιάσετε τη διαδικασία. Περιμένετε τα σημάδια ότι το παιδί σας είναι έτοιμο να αντιμετωπίσει αυτή τη μεγάλη πρόκληση. Παρακολουθήστε τα σημεία στην παρακάτω λίστα. οι πρώτες πέντε είναι απολύτως απαραίτητες: μένει ξηρό τουλάχιστον δύο ώρες παίρνει Bummed από υγρό ή ...

Η επιλογή των συντακτών

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Αναδυόμενο πεδίο της ιατρικής μυαλού-σώματος υπενθυμίζει στους ανθρώπους - και γιόγκι και σοφοί έχουν πει για χιλιετίες - το σώμα σας, το μυαλό σας και η καρδιά σας αποτελούν ένα ενιαίο και αδιάσπαστο σύνολο. Όταν οι σκέψεις σας συνεχίζουν να σφύζουν από την ανησυχία σας, το σώμα σας αποκρίνεται με τη σύσφιξη και την τάνυση, ειδικά σε ορισμένες σημαντικές θέσεις ...

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πόνος είναι κάτι που θα αντιμετωπίσει κάποιος σε κάποιο σημείο . Η προσοχή μπορεί να σας βοηθήσει να προσεγγίσετε πόνο με υγιεινό τρόπο. Ο οξύς πόνος είναι ένας αιχμηρός πόνος που διαρκεί για μικρό χρονικό διάστημα, μερικές φορές ορίζεται ως λιγότερο από 12 εβδομάδες. Η ιατρική είναι αρκετά καλή για τη θεραπεία του οξέος πόνου. Ο χρόνιος πόνος είναι ο πόνος που διαρκεί ...

Βελτίωση των σχέσεών σας - ανδρείκεS

Βελτίωση των σχέσεών σας - ανδρείκεS

Σχέσεις - είτε με την οικογένεια, τους φίλους ή τους εραστές; Και δεν έχει σημασία πόσο χαρούμενος και ευχαριστημένος είστε με τις σημαντικές σχέσεις στη ζωή σας, υπάρχει πάντα περιθώριο βελτίωσης. Οι σχέσεις, όπως όλες οι διεργασίες, επίσης καταλήγουν και ρέουν και σας παρουσιάζουν προκλήσεις. Εδώ είναι μερικές εξαιρετικές τεχνικές για να σας βοηθήσουμε ...