Σπίτι Προσωπικά Οικονομικά Πώς να Suss Στατιστικά σε ggplot2 σε R - ανδρείκελα

Πώς να Suss Στατιστικά σε ggplot2 σε R - ανδρείκελα

Πίνακας περιεχομένων:

Βίντεο: Statistical Programming with R by Connor Harris 2024

Βίντεο: Statistical Programming with R by Connor Harris 2024
Anonim

Μετά από δεδομένα, χαρτογράφηση και γεωμετρίες, το τέταρτο στοιχείο ενός στρώματος ggplot2 στο R περιγράφει πώς θα πρέπει να συνοψιστούν τα δεδομένα. Στο ggplot2, αναφέρετε αυτήν την στατιστική σύνοψη ως stat.

Ένα πολύ βολικό χαρακτηριστικό του ggplot2 είναι το εύρος των λειτουργιών του ώστε να συνοψίζει τα δεδομένα σας στο οικόπεδο. Αυτό σημαίνει ότι συχνά δεν χρειάζεται να προ-συνοψίζετε τα δεδομένα σας. Για παράδειγμα, το ύψος των ράβδων σε ένα ιστόγραμμα δείχνει πόσες παρατηρήσεις για κάτι που έχετε στα δεδομένα σας. Η στατιστική περίληψη για αυτό είναι να μετρήσουμε τις παρατηρήσεις. Οι στατιστικοί αναφέρονται σε αυτή τη διαδικασία ως binning, και το προεπιλεγμένο stat για geom_bar () είναι stat_bin ().

Ανάλογα με τον τρόπο με τον οποίο κάθε geom έχει ένα σχετικό προεπιλεγμένο stat, κάθε stat έχει επίσης προεπιλεγμένο geom.

Έτσι, αυτό προκαλεί την ερώτηση: Πώς αποφασίζετε αν θα χρησιμοποιήσετε ένα geom ή ένα stat; Θεωρητικά δεν έχει σημασία αν επιλέγετε πρώτα το geom ή το stat. Στην πράξη, ωστόσο, είναι συχνά διαισθητικό να αρχίσετε πρώτα με έναν τύπο οικόπεδο - με άλλα λόγια, να προσδιορίσετε ένα geom. Αν στη συνέχεια θέλετε να προσθέσετε ένα άλλο επίπεδο στατιστικής περίληψης, χρησιμοποιήστε ένα stat.

geom_bar (). "

Σε αυτό το γράφημα, χρησιμοποιήσατε τα ίδια δεδομένα για να δημιουργήσετε πρώτα ένα scatterplot με geom_point (), και στη συνέχεια προσθέσατε μια ομαλή γραμμή με το stat_smooth ()
stat_smooth ()
Δημιουργεί μια ομαλή γραμμή. geom_line () stat_sum ()
geom_boxplot ()
> Binning data Έχετε ήδη δει πώς να χρησιμοποιήσετε stat_bin () για να συνοψίσετε τα δεδομένα σας σε κάδους, επειδή αυτή είναι η προεπιλεγμένη stat του geom_bar ().Αυτό σημαίνει ότι οι ακόλουθες δύο γραμμές κώδικα παράγουν πανομοιότυπα οικόπεδα: >> ggplot (σεισμοί, aes (x = βάθος)) + geom_bar (binwidth = 50)> ggplot (σεισμοί, aes (x = βάθος)) + stat_bin th = 50)
Εξομάλυνση δεδομένων Το πακέτο ggplot2 καθιστά επίσης πολύ εύκολο να δημιουργήσετε γραμμές παλινδρόμησης μέσω των δεδομένων σας. Χρησιμοποιείτε τη συνάρτηση stat_smooth () για να δημιουργήσετε αυτόν τον τύπο γραμμής. Το ενδιαφέρον στοιχείο για το stat_smooth () είναι ότι χρησιμοποιεί την τοπική παλινδρόμηση από προεπιλογή. Το R έχει πολλές λειτουργίες που μπορούν να το κάνουν, αλλά το ggplot2 χρησιμοποιεί τη λειτουργία loess () για τοπική παλινδρόμηση. Αυτό σημαίνει ότι αν θέλετε να δημιουργήσετε ένα μοντέλο γραμμικής παλινδρόμησης, θα πρέπει να πείτε στο stat_smooth () να χρησιμοποιήσει μια διαφορετική λειτουργία ομαλότερης.Κάνετε αυτό με το όρισμα της μεθόδου.
Για να φανεί η χρήση μιας ομαλότερης, ξεκινήστε δημιουργώντας ένα scatterplot της ανεργίας στο σύνολο δεδομένων longley: >> p p

Στη συνέχεια, προσθέστε μια ομαλότερη. Αυτό είναι τόσο απλό όσο προσθέτοντας το stat_smooth () στη γραμμή κώδικα. >> p + stat_smooth ()

Το γραφικό σας θα πρέπει να μοιάζει με το οικόπεδο στα αριστερά της εικόνας παρακάτω.

Μερικές φορές, το ggplot2 δημιουργεί μηνύματα με επιπλέον συμβουλές και πληροφορίες. Εφόσον δεν βλέπετε προειδοποίηση ή σφάλμα, μπορείτε να αγνοήσετε με ασφάλεια αυτά τα μηνύματα. Σε αυτήν την περίπτωση, το stat_smooth () σας λέει ότι η προεπιλεγμένη ομαλότερη είναι μια μέθοδος που ονομάζεται

loess

(τοπική εξομάλυνση). Το μήνυμα λέει επίσης ότι μπορείτε να χρησιμοποιήσετε εναλλακτικές μεθόδους εξομάλυνσης.

Τέλος, χρησιμοποιήστε το stat_smooth () για να προσαρμόσετε και να σχεδιάσετε ένα μοντέλο γραμμικής παλινδρόμησης. Κάνετε αυτό προσθέτοντας τη μέθοδο argument = "lm":

p + stat_smooth (method = "lm")

Το γραφικό σας θα πρέπει τώρα να μοιάζει με το οικόπεδο προς τα δεξιά.

stat_smooth (). "

Κάνοντας τίποτα με ταυτότητα

Μερικές φορές δεν θέλετε το ggplot2 να συνοψίζει τα δεδομένα σας στο plot.Αυτό συμβαίνει συνήθως όταν τα δεδομένα σας είναι που έχουν ήδη προκαθοριστεί ή όταν κάθε γραμμή του πλαισίου δεδομένων σας πρέπει να γραφεί ξεχωριστά.Σε αυτές τις περιπτώσεις, θέλετε να πείτε στο ggplot2 να μην κάνει τίποτα καθόλου και το stat να το κάνει αυτό είναι stat_identity ().Είναι πιθανότατα να παρατηρήσετε ότι το stat_identity είναι την προεπιλεγμένη στατιστική για σημεία και γραμμές

Πώς να Suss Στατιστικά σε ggplot2 σε R - ανδρείκελα

Η επιλογή των συντακτών

Που συμμετέχουν στις Συνιστώμενες Ομάδες στο LinkedIn - ανδρείκελα

Που συμμετέχουν στις Συνιστώμενες Ομάδες στο LinkedIn - ανδρείκελα

Υπάρχουν περισσότερες από δύο εκατομμύρια ομάδες στο LinkedIn. Αναζήτηση στο LinkedIn για να βρείτε ομάδες που ταιριάζουν με το κοινό-στόχο και τα ενδιαφέροντά σας ή επιτρέψτε στο LinkedIn να σας συστήσει ομάδες. Το LinkedIn εξετάζει τις κοινότητες που μοιράζεστε με μέλη διαφορετικών ομάδων, όπως εταιρείες, σχολεία ή βιομηχανίες. Αυτές οι ομάδες με μέλη που έχουν τα περισσότερα χαρακτηριστικά ...

Πώς να γράψετε την περίληψη για το προφίλ σας LinkedIn - ανδρείκελα

Πώς να γράψετε την περίληψη για το προφίλ σας LinkedIn - ανδρείκελα

Το προφίλ LinkedIn εμφανίζεται στο τρίτο τρίτο του προφίλ σας, θα πρέπει να δώσει στον αναγνώστη μια γρήγορη ιδέα για το ποιος είστε, τι έχετε επιτύχει και, το σημαντικότερο, τι ψάχνετε στο LinkedIn. Μερικοί άνθρωποι σκέφτονται την περίληψή τους ως "γήπεδο ανελκυστήρα", ή την εισαγωγή τους 30 δευτερολέπτων οι ίδιοι ότι ...

LinkedInIn Group Κατηγορίες - ανδρείκελα

LinkedInIn Group Κατηγορίες - ανδρείκελα

Επειδή υπάρχουν πολλοί λόγοι για να δημιουργήσετε μια ομάδα LinkedIn σας δίνει επιλογές για κατηγοριοποίηση της ομάδας σας για να σας δώσει την μεγαλύτερη έκθεση. Το LinkedIn έχει δημιουργήσει τις ακόλουθες έξι βασικές κατηγορίες ομάδων: Αποφοίτων: Αυτές οι ομάδες είναι ενώσεις αποφοίτων που δημιουργούνται από σχολεία ή εκπαιδευτικά ιδρύματα ως μέσο για να διατηρούν επαφή με το παρελθόν ...

Η επιλογή των συντακτών

Πώς να εφαρμόσετε τις εντολές στις μηχανές Minecraft Redstone - dummies

Πώς να εφαρμόσετε τις εντολές στις μηχανές Minecraft Redstone - dummies

Αντικατάσταση κυκλωμάτων. Στο Minecraft, τα μπλοκ εντολών ενεργοποιούνται κάθε φορά που τροφοδοτούνται από το ρεύμα redstone - έτσι, όταν συνδέονται σε ένα κύκλωμα redstone, μπορούν να λειτουργήσουν με ενδιαφέροντα τρόπους. Υπάρχουν διάφοροι τρόποι ενσωμάτωσης των μπλοκ εντολών και των κυκλωμάτων. Δημιουργία αδύνατων μηχανών με κυκλώματα εντολών Μερικές φορές, κυκλώματα redstone ...

Πώς να οικοδομήσουμε κύκλους και σφαίρες στο Minecraft - dummies

Πώς να οικοδομήσουμε κύκλους και σφαίρες στο Minecraft - dummies

Σε έναν κόσμο όπου όλα αποτελούνται από τετράγωνα και κύβους , δημιουργώντας οτιδήποτε είναι τελείως στρογγυλό στον κόσμο του Minecraft είναι αδύνατο. Αλλά αν έχετε την καρδιά σας σε κύκλους ή σφαίρες, υπάρχει ένα τέχνασμα: Μπορείτε να έρθετε κοντά τοποθετώντας στοίβα μπλοκ. Δημιουργώντας έναν κύκλο Η οικοδόμηση ενός κύκλου βασίζεται σε τεχνικές παρόμοιες με εκείνες ...

Πώς να οικοδομήσουμε ένα καταφύγιο και μια πόρτα στο Minecraft - dummy

Πώς να οικοδομήσουμε ένα καταφύγιο και μια πόρτα στο Minecraft - dummy

Στο Minecraft, περιπλάνηση στο ύπαιθρο συνήθως δεν είναι πρόβλημα κατά τη διάρκεια της ημέρας, αλλά το περιβάλλον γίνεται πιο επικίνδυνο τη νύχτα. Εάν τα λεπτά της ημέρας πέφτουν και δεν αισθάνεστε έτοιμοι να πολεμήσετε (που πιθανώς είναι αλήθεια την πρώτη ημέρα σας), χρειάζεστε καταφύγιο. Τοποθετώντας πολλά από τα μπλοκ που έχετε συγκεντρώσει, ...

Η επιλογή των συντακτών

Δικτύου Παρέχονται υπηρεσίες Cloud computing - dummies

Δικτύου Παρέχονται υπηρεσίες Cloud computing - dummies

, πλατφόρμες και υπηρεσίες (υποδομή). Οι παρακάτω παράγραφοι περιγράφουν λεπτομερέστερα αυτούς τους τρεις τύπους υπηρεσιών Cloud. Εφαρμογές στο σύννεφο Συχνά αναφέρεται ως λογισμικό ως υπηρεσία (SaaS), πλήρως λειτουργικές εφαρμογές μπορούν να παραδοθούν μέσω του cloud. Ένα από τα ...

IOS Cloud Development Για Ανδρείκελα Cheat Sheet - dummies

IOS Cloud Development Για Ανδρείκελα Cheat Sheet - dummies

Όταν μιλάτε για προγραμματισμό Cloud iOS, μιλάμε για δύο πράγματα: το iCloud (το οποίο υλοποιείται για εσάς από την Apple και σας επιτρέπει να συγχρονίζετε δεδομένα μεταξύ των συσκευών) και τις υπηρεσίες ιστού (οι οποίες σας επιτρέπουν να κάνετε κάποια επεξεργασία της εφαρμογής σας από έναν απομακρυσμένο υπολογιστή κάπου στη μέση του που γνωρίζει πού). ...

Κατανόηση Συνεργασία ως υπηρεσία στο Cloud Computing - dummies

Κατανόηση Συνεργασία ως υπηρεσία στο Cloud Computing - dummies

Στο μέλλον, οι εταιρείες είναι πιθανό να προσφέρουν ενοποιημένη επικοινωνιών (ενσωμάτωση τηλεφωνίας, άμεσων μηνυμάτων και ηλεκτρονικού ταχυδρομείου) ως υπηρεσία για Cloud computing. Η συνεργασία είναι μία από τις φυσικές αγορές για το cloud computing και το λογισμικό ως υπηρεσία (SaaS). Υπάρχει αρκετό εύρος ζώνης και όλες οι εταιρείες συνδέονται με το Διαδίκτυο. Τι εταιρείες επικεντρώνουν ...