Βίντεο: Unblock Mag 254 250 256 and Mag 322 2024
Για τις προβλέψεις, πρέπει να φορτώσετε τα δεδομένα για τους αλγόριθμους που θέλετε να χρησιμοποιήσετε. Η φόρτωση του συνόλου δεδομένων Iris στο scikit είναι τόσο απλή όσο και η έκδοση δύο γραμμών κώδικα επειδή το scikit έχει ήδη δημιουργήσει μια συνάρτηση για τη φόρτωση του συνόλου δεδομένων.
Μήκος Sepal | Πλάτος Sepal | Μήκος Πεταλούδας | Πλάτος Petal | Κλάση / Ετικέτα Target |
---|---|---|---|---|
5. 1 | 3. 5 | 1. 4 | 0. 2 | Setosa (0) |
7. 0 | 3. 2 | 4. 7 | 1. 4 | Versicolor (1) |
6. 3 | 3. 3 | 6. 0 | 2. 5 | Virginica (2) |
-
Ανοίξτε μια νέα περίοδο λειτουργίας του διαδραστικού shell του Python.
Χρησιμοποιήστε μια νέα συνεδρία Python, ώστε να μην υπάρχει τίποτα που να παραμένει στη μνήμη και να έχετε μια καθαρή πλάκα για να δουλέψετε.
-
Πληκτρολογήστε τον ακόλουθο κώδικα στην εντολή και παρατηρήστε την έξοδο: >>>> από το sklearn. data setset load_iris >>> iris = load_iris ()
Μετά την εκτέλεση αυτών των δύο δηλώσεων, δεν θα πρέπει να βλέπετε μηνύματα από τον διερμηνέα. Η μεταβλητή ίριδα πρέπει να περιέχει όλα τα δεδομένα από την ίριδα. csv αρχείο.
Πριν δημιουργήσετε ένα μοντέλο πρόβλεψης, είναι σημαντικό να καταλάβετε λίγα πράγματα σχετικά με τη νέα μεταβλητή ίριδα και τι μπορείτε να κάνετε με αυτήν. Κάνει τον κώδικα πιο εύκολο να ακολουθήσει και η διαδικασία είναι πολύ πιο εύκολη στην κατανόηση. Μπορείτε να ελέγξετε την αξία της ίριδας πληκτρολογώντας τον στον διερμηνέα. >>>> ίριδα
Η έξοδος θα είναι όλο το περιεχόμενο από την ίριδα. csv, μαζί με κάποιες άλλες πληροφορίες σχετικά με το σύνολο δεδομένων που έχει φορτωθεί στη μεταβλητή η συνάρτηση load_iris. Η μεταβλητή είναι δομή δεδομένων λεξικού με τέσσερις κύριες ιδιότητες. Οι σημαντικές ιδιότητες της ίριδας παρατίθενται παρακάτω.
Όνομα ιδιότητας
Περιγραφήδεδομένα | Περιέχει όλες τις μετρήσεις των παρατηρήσεων. |
---|---|
feature_name | Περιέχει το όνομα της ιδιότητας (όνομα χαρακτηριστικού). |
στόχος | Περιέχει όλους τους στόχους (ετικέτες) των παρατηρήσεων. |
target_names | Περιέχει τα ονόματα των κλάσεων. |
Μπορείτε να εκτυπώσετε τις τιμές στον διερμηνέα πληκτρολογώντας το όνομα της μεταβλητής που ακολουθείται από τελεία που ακολουθείται από το όνομα της ιδιότητας. Ένα παράδειγμα είναι η χρήση ίριδας. δεδομένα για πρόσβαση στην ιδιότητα της ίριδας, όπως παρακάτω: ίριδα >>>>. δεδομένα | Αυτός είναι ένας τυπικός τρόπος πρόσβασης σε ιδιότητες ενός αντικειμένου σε πολλές γλώσσες προγραμματισμού. |
Για να δημιουργήσετε μια εμφάνιση του ταξινομητή SVM, πληκτρολογήστε τον ακόλουθο κώδικα στον διερμηνέα: >>>> από το sklearn. svm import LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)
Η πρώτη γραμμή κώδικα εισάγει τη βιβλιοθήκη γραμμικού SVC στην περίοδο λειτουργίας. Ο γραμμικός ταξινομητής φορέα υποστήριξης (SVC) είναι μια υλοποίηση του SVM για γραμμική ταξινόμηση και έχει υποστήριξη πολλαπλών κατηγοριών.Το σύνολο δεδομένων είναι κάπως γραμμικά διαχωρίσιμο και έχει τρεις κατηγορίες, οπότε θα ήταν καλή ιδέα να πειραματιστείτε με το Linear SVC για να δείτε πώς εκτελείται.
Η δεύτερη γραμμή δημιουργεί την παρουσία χρησιμοποιώντας τη μεταβλητή svmClassifier. Αυτή είναι μια σημαντική μεταβλητή που πρέπει να θυμόμαστε. Η παράμετρος random_state σάς επιτρέπει να αναπαράγετε αυτά τα παραδείγματα και να έχετε τα ίδια αποτελέσματα. Αν δεν βάλατε την παράμετρο random_state, τα αποτελέσματά σας μπορεί να διαφέρουν από αυτά που εμφανίζονται εδώ.