Πίνακας περιεχομένων:
- Πώς να κάνετε αριθμητική σε στήλες ένα πλαίσιο δεδομένων
- Μετά από σύντομο γράψιμο των υποσυνόλων σε R, θα έχετε κουραστεί να δακτυλογραφήσετε το σύμβολο του δολαρίου για να εξαγάγετε τις στήλες ενός πλαισίου δεδομένων . Ευτυχώς, υπάρχει ένας τρόπος για να μειώσετε το μέγεθος της πληκτρολόγησης και να κάνετε τον κώδικα σας πιο ευανάγνωστο ταυτόχρονα. Το κόλπο είναι να χρησιμοποιήσετε τη λειτουργία με (). Δοκιμάστε αυτό: >> y <- με (ίριδα, Sepal, Length / Sepal, Width)
Βίντεο: Stress, Portrait of a Killer - Full Documentary (2008) 2024
Αφού δημιουργήσετε το κατάλληλο υποσύνολο των δεδομένων σας, το επόμενο βήμα της ανάλυσής σας είναι πιθανό να εκτελέσετε ορισμένους υπολογισμούς με R.
Πώς να κάνετε αριθμητική σε στήλες ένα πλαίσιο δεδομένων
R καθιστά πολύ εύκολο να πραγματοποιήσει υπολογισμούς σε στήλες ενός πλαισίου δεδομένων επειδή κάθε στήλη είναι η ίδια φορέας. Κολλώντας στο πλαίσιο δεδομένων της ίριδας, προσπαθήστε να κάνετε μερικούς υπολογισμούς στις στήλες. Για παράδειγμα, υπολογίστε την αναλογία μεταξύ των μηκών και του πλάτους των sepals:
x <- ίριδα $ Sepal. Μήκος / ίριδα $ Sepal. Πλάτος
Τώρα μπορείτε να χρησιμοποιήσετε όλα τα εργαλεία R για να εξετάσετε το αποτέλεσμά σας. Για παράδειγμα, επιθεωρήστε τα πρώτα πέντε στοιχεία των αποτελεσμάτων σας με τη λειτουργία head (): >> head (x) [1] 1. 457143 1. 633333 1. 468750 1. 483871 1. 388889 1. 384615
Όπως μπορείτε να δείτε, η εκτέλεση υπολογισμών σε στήλες ενός πλαισίου δεδομένων είναι απλή. Απλά λάβετε υπόψη ότι κάθε στήλη είναι πραγματικά ένα διάνυσμα, οπότε απλά πρέπει να θυμάστε πώς να εκτελέσετε εργασίες σε φορείς.Τρόπος χρήσης με και μέσα για τη βελτίωση της αναγνωσιμότητας του κώδικα
Μετά από σύντομο γράψιμο των υποσυνόλων σε R, θα έχετε κουραστεί να δακτυλογραφήσετε το σύμβολο του δολαρίου για να εξαγάγετε τις στήλες ενός πλαισίου δεδομένων. Ευτυχώς, υπάρχει ένας τρόπος για να μειώσετε το μέγεθος της πληκτρολόγησης και να κάνετε τον κώδικα σας πιο ευανάγνωστο ταυτόχρονα. Το κόλπο είναι να χρησιμοποιήσετε τη λειτουργία με (). Δοκιμάστε αυτό: >> y <- με (ίριδα, Sepal, Length / Sepal, Width)
Η λειτουργία με () σας επιτρέπει να ανατρέξετε στις στήλες μέσα σε ένα πλαίσιο δεδομένων χωρίς να χρησιμοποιήσετε ρητά το σύμβολο του δολαρίου ή ακόμα και το όνομα του ίδιου του πλαισίου δεδομένων. Έτσι, στο παράδειγμα μας, επειδή χρησιμοποιείτε με (ίριδα, …), το R ξέρει να αξιολογήσει και τον Sepal. Μήκος και Sepal. Πλάτος στο πλαίσιο της ίριδας.
Ας ελπίσουμε ότι συμφωνείτε ότι αυτό είναι πολύ πιο εύκολο να διαβαστεί και να κατανοηθεί. Με την εκτύπωση των τιμών της νέας σας μεταβλητής y, μπορείτε να επιβεβαιώσετε ότι είναι πανομοιότυπο με το x στο προηγούμενο παράδειγμα. >> 1.457143 1. 633333 1. 468750 1. 483871 1. 388889 1. 384615
Μπορείτε επίσης να χρησιμοποιήσετε τη συνάρτηση identical () για να πάρετε το R για να σας πει εάν αυτές οι τιμές είναι, στην πραγματικότητα, τα ίδια:
πανομοιότυπη (x, y) [1] TRUE
Εκτός από το (), η βοηθητική λειτουργία within () σας δίνει τη δυνατότητα να εκχωρήσετε πολύ εύκολα τιμές στις στήλες στα δεδομένα σας. Ας υποθέσουμε ότι θέλετε να προσθέσετε τον υπολογισμό του λόγου του μήκους του sepal σε πλάτος στο αρχικό πλαίσιο δεδομένων. Είστε ήδη εξοικειωμένοι με το γράψιμό του ως εξής: >> αναλογία iris $ <- ίριδα $ Sepal. Μήκος / ίριδα $ Sepal. Πλάτος
Τώρα, χρησιμοποιώντας μέσα () μετατρέπεται σε:>> ίριδα <- εντός (ίριδα, λόγος <- sepal.Μήκος / Σεπάλι. Πλάτος)
Αυτό λειτουργεί με πολύ παρόμοιο τρόπο με το (), εκτός από το ότι μπορείτε να χρησιμοποιήσετε τον χειριστή εκχώρησης (<-) μέσα στη λειτουργία σας. Αν κοιτάξετε τώρα τη δομή της ίριδας, θα παρατηρήσετε ότι ο λόγος είναι μια στήλη: >> κεφαλή (αναλογία ίριδας $) [1] 1. 457143 1. 633333 1. 468750 1. 483871 1. 388889 1. 384615