Πίνακας περιεχομένων:
- Πώς να δημιουργήσετε μια γραφική παράσταση πυκνότητας
- Έτσι, αντί να σχεδιάσετε τις μετρήσεις στο ιστόγραμμα, θα μπορούσατε να σχεδιάσετε τις πυκνότητες. R κάνει όλους τους υπολογισμούς για σας - το μόνο που πρέπει να κάνετε είναι να ρυθμίσετε το freq όρισμα του hist () στο FALSE, όπως παρακάτω: >> hist (αυτοκίνητα $ mpg, col = "γκρι", freq = FALSE)
Βίντεο: John Henry Faulk Interview: Education, Career, and the Hollywood Blacklist 2024
Διαγράφοντας τα δεδομένα σας σε διαστήματα στο R, χάνετε ακόμα κάποιες πληροφορίες. Ωστόσο, ο πιο πλήρης τρόπος περιγραφής των δεδομένων σας είναι η εκτίμηση της πυκνότητας πιθανότητας (PDF) ή της πυκνότητας της μεταβλητής σας.
Αν αυτή η ιδέα δεν είναι εξοικειωμένη με εσάς, μην ανησυχείτε. Απλά θυμηθείτε ότι η πυκνότητα είναι ανάλογη με την πιθανότητα ότι οποιαδήποτε τιμή στα δεδομένα σας είναι περίπου ίση με αυτή την τιμή. Στην πραγματικότητα, για ένα ιστόγραμμα, η πυκνότητα υπολογίζεται από τις μετρήσεις, οπότε η μόνη διαφορά μεταξύ ενός ιστογράμματος με συχνότητες και ενός με πυκνότητες είναι η κλίμακα της άκρης y . Για τα υπόλοιπα, μοιάζουν ακριβώς τα ίδια.
Πώς να δημιουργήσετε μια γραφική παράσταση πυκνότητας
Μπορείτε να υπολογίσετε τη συνάρτηση πυκνότητας μιας μεταβλητής χρησιμοποιώντας τη συνάρτηση density (). Η έξοδος αυτής της λειτουργίας δεν σας λέει πολύ, αλλά μπορείτε εύκολα να την χρησιμοποιήσετε σε μια πλοκή. Για παράδειγμα, μπορείτε να πάρετε την πυκνότητα της μεταβλητής μιλίων mpg όπως αυτή: >> mpgdens <- πυκνότητα (αυτοκίνητα $ mpg)
Το αντικείμενο που παίρνετε με αυτόν τον τρόπο είναι ένας κατάλογος που περιέχει πολλές πληροφορίες που δεν έχετε πραγματικά πρέπει να εξετάσουμε. Αλλά αυτή η λίστα καθιστά την σχεδίαση της πυκνότητας τόσο εύκολη όσο λέει "σχεδιάστε την πυκνότητα":
>> plot (mpgdens)
Το γράφημα φαίνεται λίγο τραχύ στα άκρα, αλλά το σημαντικό είναι να δούμε πώς τα δεδομένα σας βγαίνουν. Το αντικείμενο πυκνότητας απεικονίζεται ως γραμμή, με τις πραγματικές τιμές των δεδομένων σας στην τιμήx
-αξία και την πυκνότητα στην τιμή y . Το αντικείμενο λίστας mpgdens περιέχει - μεταξύ άλλων - ένα στοιχείο που ονομάζεται x και το ένα ονομάζεται y. Αυτά αντιπροσωπεύουν τους συντελεστές x
- και y για την απεικόνιση της πυκνότητας. Όταν το R υπολογίζει την πυκνότητα, η συνάρτηση πυκνότητας () χωρίζει τα δεδομένα σας σε διάφορα μικρά διαστήματα και υπολογίζει την πυκνότητα για το μεσαίο σημείο κάθε διαστήματος. Αυτά τα μεσαία σημεία είναι οι τιμές για το x, και οι υπολογισμένες πυκνότητες είναι οι τιμές για το y.
Έτσι, αντί να σχεδιάσετε τις μετρήσεις στο ιστόγραμμα, θα μπορούσατε να σχεδιάσετε τις πυκνότητες. R κάνει όλους τους υπολογισμούς για σας - το μόνο που πρέπει να κάνετε είναι να ρυθμίσετε το freq όρισμα του hist () στο FALSE, όπως παρακάτω: >> hist (αυτοκίνητα $ mpg, col = "γκρι", freq = FALSE)
Τώρα το οικόπεδο θα φαίνεται ακριβώς το ίδιο όπως πριν. μόνο οι τιμές στην τιμή
y
είναι διαφορετικές.Η κλίμακα στην άκρη
y ρυθμίζεται κατά τέτοιο τρόπο ώστε να μπορείτε να προσθέσετε το γράφημα πυκνότητας στο ιστόγραμμα. Για αυτό, χρησιμοποιείτε τη συνάρτηση γραμμών () με το αντικείμενο πυκνότητας ως το όρισμα. Έτσι, για παράδειγμα, μπορείτε να φανταστείτε το προηγούμενο ιστόγραμμα λίγο περισσότερο προσθέτοντας την εκτιμώμενη πυκνότητα χρησιμοποιώντας τον ακόλουθο κώδικα αμέσως μετά την προηγούμενη εντολή: >> γραμμές (mpgdens) Βλέπετε το αποτέλεσμα αυτές οι δύο εντολές στη δεξιά πλευρά. Θυμηθείτε ότι οι γραμμές () χρησιμοποιούν τα στοιχεία x και y από το αντικείμενο πυκνότητας mpgdens για να σχεδιάσετε τη γραμμή.