Βίντεο: McDonald's Listened to My Advice (Finally!) 2024
Για να υπολογίσετε ποια δεδομένα μπορούν να ληφθούν υπόψη κατά την εργασία στο R, ας ρίξουμε μια ματιά στο σύνολο δεδομένων mtcars. Αυτό το ενσωματωμένο σύνολο δεδομένων περιγράφει την κατανάλωση καυσίμου και δέκα διαφορετικούς σχεδιαστικούς δείκτες από 32 αυτοκίνητα από τη δεκαετία του '70. Περιέχει συνολικά 11 μεταβλητές, αλλά όλες είναι αριθμητικές.
Παρόλο που μπορείτε να εργαστείτε με το πλαίσιο δεδομένων ως έχει, ορισμένες μεταβλητές θα μπορούσαν να μετατραπούν σε έναν παράγοντα επειδή έχουν περιορισμένο αριθμό τιμών.
Λάβετε τις μοναδικές τιμές της μεταβλητής χρησιμοποιώντας το-
unique () . Βρείτε το μήκος του διανύσματος που προκύπτει χρησιμοποιώντας
-
μήκος () . Χρησιμοποιώντας τη λειτουργία sapply (), μπορείτε να το κάνετε αυτό για ολόκληρο το πλαίσιο δεδομένων ταυτόχρονα. Εφαρμόζετε μια ανώνυμη λειτουργία που συνδυάζει και τα δύο βήματα σε όλο το πλαίσιο δεδομένων, όπως παρακάτω:
Όταν η μεταχείριση μιας μεταβλητής σαν παράγοντας εξαρτάται λίγο από την κατάσταση, αλλά, κατά γενικό κανόνα, αποφεύγετε περισσότερα από δέκα διαφορετικά επίπεδα σε έναν παράγοντα και προσπαθήστε να έχετε τουλάχιστον πέντε τιμές ανά επίπεδο.