Πίνακας περιεχομένων:
- Πώς να χρησιμοποιήσετε την περικοπή για να δημιουργήσετε έναν σταθερό αριθμό υποομάδων
- Το επίπεδο τα ονόματα δεν είναι πολύ φιλικά προς το χρήστη, οπότε καθορίστε μερικά καλύτερα ονόματα με το l abels επιχείρημα: >> περικοπή (παγετός, 3, περιλαμβάνουν. χαμηλότερο = TRUE, ετικέτες = c ("Χαμηλό", "Μεσαίο", "Υψηλό")) [1] Χαμηλή Υψηλή Χαμηλή Μεσαία χαμηλή Υψηλή Μεσαία χαμηλή Χαμηλή Χαμηλή …
Βίντεο: Working in Offline Mode 2024
Η λειτουργία cut () στο R δημιουργεί κάδους ίσου μεγέθους (από προεπιλογή) στα δεδομένα σας και στη συνέχεια ταξινομεί κάθε στοιχείο κατάλληλος κάδος.
Αν αυτό ακούγεται σαν μπουκάλι, μην ανησυχείτε. Μερικά παραδείγματα θα πρέπει να κάνουν αυτό να ζωντανέψει.
Πώς να χρησιμοποιήσετε την περικοπή για να δημιουργήσετε έναν σταθερό αριθμό υποομάδων
Για να δείξετε τη χρήση της περικοπής (), ρίξτε μια ματιά στην κατάσταση του ενσωματωμένου συνόλου δεδομένων. x77, ένας πίνακας με αρκετές στήλες και μία σειρά για κάθε κατάσταση στις Ηνωμένες Πολιτείες:
κεφαλή (κράτος x77) Πληθυσμός Εισόδημα Αναλφαβητισμός Ζωή Εκρηκτικός Ε.Π.Σ. Γήπεδο Περιοχή παγετού Αλαμπάμα 3615 3624 2. 1 69. 05 15. 1 41. 3 20 50708 Αλάσκα 365 6315 1. 5 69 31 11. 3 66. 7 152 566432 Αριζόνα 2212 4530 1. 8 70. 55 7. 8 58. 1 15 113417 Αρκάνσας 2110 3378 1. 9 70. 66 10. 1 39. 9 65 51945 Καλιφόρνια 21198 5114 1. 1 71. 71 10. 3 62. 6 20 156361 Κολοράντο 2541 4884 0. 7 72. 06 6. 8 63. 9 166 103766
Θέλετε να εργαστείτε με τη στήλη που ονομάζεται Frost. Για να εξαγάγετε αυτήν τη στήλη, δοκιμάστε τα εξής:
παγωμένο κεφάλι (πάγος, 5) Αλαμπάμα Αλάσκα Αριζόνα Αρκάνσας Καλιφόρνια 20 152 15 65 20
Τώρα έχετε ένα νέο αντικείμενο, τον παγετό, έναν αριθμημένο διάνυσμα. Τώρα χρησιμοποιήστε το cut () για να δημιουργήσετε τρία δοχεία στα δεδομένα σας: >> cut (παγετός, 3, include lowest = TRUE) [1] [-0. 188, 62,6] (125, 188] [-0,188,62] [62,6,125] [5] [0,188,62] (125,188) (125,188] (62,6,125) … [45] (125,188) (62,6,125) [-0,188,62] [62,6,125] [49] (125, 188) (125, 188] Επίπεδα: [-0.188, 62.6] (62. 6, 125] (125, 188)
Το αποτέλεσμα είναι ένας παράγοντας με τρία επίπεδα: Τα ονόματα των επιπέδων φαίνονται λίγο περίπλοκα, αλλά σας λένε σε μαθηματικά οριζόμενη συμβολική αναφορά ποια είναι τα όρια των κάδων σας.Για παράδειγμα, ο πρώτος κάδος περιέχει εκείνες τις καταστάσεις που έχουν παγετό μεταξύ -0,188 και 62. 8 ημέρες
Τρόπος προσθήκης ετικετών για αποκοπή
Το επίπεδο τα ονόματα δεν είναι πολύ φιλικά προς το χρήστη, οπότε καθορίστε μερικά καλύτερα ονόματα με το l abels επιχείρημα: >> περικοπή (παγετός, 3, περιλαμβάνουν. χαμηλότερο = TRUE, ετικέτες = c ("Χαμηλό", "Μεσαίο", "Υψηλό")) [1] Χαμηλή Υψηλή Χαμηλή Μεσαία χαμηλή Υψηλή Μεσαία χαμηλή Χαμηλή Χαμηλή …
Τώρα έχετε έναν παράγοντα που κατατάσσει τα κράτη σε χαμηλό, μεσαίο και υψηλό, ανάλογα με τον αριθμό των ημερών παγετού που παίρνουν.
Πώς να χρησιμοποιήσετε τον πίνακα για να μετρήσετε τον αριθμό των παρατηρήσεων
Ένα ενδιαφέρον κομμάτι ανάλυσης είναι να μετρήσετε πόσες καταστάσεις είναι σε κάθε κατηγορία. Μπορείτε να το κάνετε αυτό με τη συνάρτηση table (), η οποία μετρά απλά τον αριθμό των παρατηρήσεων σε κάθε επίπεδο του συντελεστή σας.x πίνακας (x) x Χαμηλό Μεσαίο Υψηλό 11 19 20