Πίνακας περιεχομένων:
- Στη συνέχεια, προσθέστε μια ομαλότερη. Αυτό είναι τόσο απλό όσο προσθέτοντας το stat_smooth () στη γραμμή κώδικα. >> p + stat_smooth ()
- loess
Βίντεο: Statistical Programming with R by Connor Harris 2024
Μετά από δεδομένα, χαρτογράφηση και γεωμετρίες, το τέταρτο στοιχείο ενός στρώματος ggplot2 στο R περιγράφει πώς θα πρέπει να συνοψιστούν τα δεδομένα. Στο ggplot2, αναφέρετε αυτήν την στατιστική σύνοψη ως stat.
Ένα πολύ βολικό χαρακτηριστικό του ggplot2 είναι το εύρος των λειτουργιών του ώστε να συνοψίζει τα δεδομένα σας στο οικόπεδο. Αυτό σημαίνει ότι συχνά δεν χρειάζεται να προ-συνοψίζετε τα δεδομένα σας. Για παράδειγμα, το ύψος των ράβδων σε ένα ιστόγραμμα δείχνει πόσες παρατηρήσεις για κάτι που έχετε στα δεδομένα σας. Η στατιστική περίληψη για αυτό είναι να μετρήσουμε τις παρατηρήσεις. Οι στατιστικοί αναφέρονται σε αυτή τη διαδικασία ως binning, και το προεπιλεγμένο stat για geom_bar () είναι stat_bin ().
Ανάλογα με τον τρόπο με τον οποίο κάθε geom έχει ένα σχετικό προεπιλεγμένο stat, κάθε stat έχει επίσης προεπιλεγμένο geom.
Έτσι, αυτό προκαλεί την ερώτηση: Πώς αποφασίζετε αν θα χρησιμοποιήσετε ένα geom ή ένα stat; Θεωρητικά δεν έχει σημασία αν επιλέγετε πρώτα το geom ή το stat. Στην πράξη, ωστόσο, είναι συχνά διαισθητικό να αρχίσετε πρώτα με έναν τύπο οικόπεδο - με άλλα λόγια, να προσδιορίσετε ένα geom. Αν στη συνέχεια θέλετε να προσθέσετε ένα άλλο επίπεδο στατιστικής περίληψης, χρησιμοποιήστε ένα stat.
stat_smooth () | ||
Δημιουργεί μια ομαλή γραμμή. | geom_line () | stat_sum () |
geom_boxplot () |
|
|
> Binning data | Έχετε ήδη δει πώς να χρησιμοποιήσετε stat_bin () για να συνοψίσετε τα δεδομένα σας σε κάδους, επειδή αυτή είναι η προεπιλεγμένη stat του geom_bar ().Αυτό σημαίνει ότι οι ακόλουθες δύο γραμμές κώδικα παράγουν πανομοιότυπα οικόπεδα: >> ggplot (σεισμοί, aes (x = βάθος)) + geom_bar (binwidth = 50)> ggplot (σεισμοί, aes (x = βάθος)) + stat_bin th = 50) | |
Εξομάλυνση δεδομένων | Το πακέτο ggplot2 καθιστά επίσης πολύ εύκολο να δημιουργήσετε γραμμές παλινδρόμησης μέσω των δεδομένων σας. Χρησιμοποιείτε τη συνάρτηση stat_smooth () για να δημιουργήσετε αυτόν τον τύπο γραμμής. | Το ενδιαφέρον στοιχείο για το stat_smooth () είναι ότι χρησιμοποιεί την τοπική παλινδρόμηση από προεπιλογή. Το R έχει πολλές λειτουργίες που μπορούν να το κάνουν, αλλά το ggplot2 χρησιμοποιεί τη λειτουργία loess () για τοπική παλινδρόμηση. Αυτό σημαίνει ότι αν θέλετε να δημιουργήσετε ένα μοντέλο γραμμικής παλινδρόμησης, θα πρέπει να πείτε στο stat_smooth () να χρησιμοποιήσει μια διαφορετική λειτουργία ομαλότερης.Κάνετε αυτό με το όρισμα της μεθόδου. |
Στη συνέχεια, προσθέστε μια ομαλότερη. Αυτό είναι τόσο απλό όσο προσθέτοντας το stat_smooth () στη γραμμή κώδικα. >> p + stat_smooth ()
Το γραφικό σας θα πρέπει να μοιάζει με το οικόπεδο στα αριστερά της εικόνας παρακάτω.
Μερικές φορές, το ggplot2 δημιουργεί μηνύματα με επιπλέον συμβουλές και πληροφορίες. Εφόσον δεν βλέπετε προειδοποίηση ή σφάλμα, μπορείτε να αγνοήσετε με ασφάλεια αυτά τα μηνύματα. Σε αυτήν την περίπτωση, το stat_smooth () σας λέει ότι η προεπιλεγμένη ομαλότερη είναι μια μέθοδος που ονομάζεται
loess
(τοπική εξομάλυνση). Το μήνυμα λέει επίσης ότι μπορείτε να χρησιμοποιήσετε εναλλακτικές μεθόδους εξομάλυνσης.
Τέλος, χρησιμοποιήστε το stat_smooth () για να προσαρμόσετε και να σχεδιάσετε ένα μοντέλο γραμμικής παλινδρόμησης. Κάνετε αυτό προσθέτοντας τη μέθοδο argument = "lm":
p + stat_smooth (method = "lm")
Το γραφικό σας θα πρέπει τώρα να μοιάζει με το οικόπεδο προς τα δεξιά.
stat_smooth (). "
Κάνοντας τίποτα με ταυτότητα
Μερικές φορές δεν θέλετε το ggplot2 να συνοψίζει τα δεδομένα σας στο plot.Αυτό συμβαίνει συνήθως όταν τα δεδομένα σας είναι που έχουν ήδη προκαθοριστεί ή όταν κάθε γραμμή του πλαισίου δεδομένων σας πρέπει να γραφεί ξεχωριστά.Σε αυτές τις περιπτώσεις, θέλετε να πείτε στο ggplot2 να μην κάνει τίποτα καθόλου και το stat να το κάνει αυτό είναι stat_identity ().Είναι πιθανότατα να παρατηρήσετε ότι το stat_identity είναι την προεπιλεγμένη στατιστική για σημεία και γραμμές