Πίνακας περιεχομένων:
- Πώς να συγκρίνετε δύο δείγματα δεδομένων
- Πώς να χρησιμοποιήσετε μια γραφική παράσταση RQQ για να ελέγξετε την ομαλότητα των δεδομένων
Βίντεο: Καίγοντας το μέλλον (Incinerando el futuro) 2025
Τα ιστογράμματα αφήνουν πολλά για την ερμηνεία του θεατή. Ένας καλύτερος γραφικός τρόπος στο R για να δούμε αν τα δεδομένα σας διανέμονται κανονικά είναι να εξετάσουμε μια λεγόμενη γραφική παράσταση quantile-quantile (QQ).
Με αυτήν την τεχνική, ορίζετε ποσοτικά μεταξύ τους. Εάν συγκρίνετε δύο δείγματα, για παράδειγμα, μπορείτε να συγκρίνετε απλώς τις ποσότητες και των δύο δειγμάτων. Ή, για να το θέσουμε λίγο διαφορετικά, το R κάνει τα εξής για να κατασκευάσει ένα οικόπεδο QQ:
-
Ταξινόμηση των δεδομένων και των δύο δειγμάτων.
-
Σχεδιάζει αυτές τις ταξινομημένες τιμές μεταξύ τους.
Αν και τα δύο δείγματα δεν περιέχουν τον ίδιο αριθμό τιμών, το R υπολογίζει επιπλέον τιμές με παρεμβολή για το μικρότερο δείγμα για να δημιουργήσει δύο δείγματα του ίδιου μεγέθους.
Πώς να συγκρίνετε δύο δείγματα δεδομένων
Φυσικά, δεν χρειάζεται να το κάνετε μόνοι σας, μπορείτε απλά να χρησιμοποιήσετε τη λειτουργία qqplot () για αυτό. Έτσι, για να ελέγξετε αν οι θερμοκρασίες κατά τη διάρκεια της δραστηριότητας και κατά τη διάρκεια της ανάπαυσης κατανέμονται εξίσου, κάνετε τα εξής:
qqplot (beaver2 $ temp [beaver2 $ active == 1], + beaver2 $ temp [beaver2 $ active == 0])
ο ένας εναντίον του άλλου.
Ανάμεσα στις αγκύλες, μπορείτε να χρησιμοποιήσετε ένα λογικό διάνυσμα για να επιλέξετε τις περιπτώσεις που θέλετε. Εδώ επιλέγετε όλες τις περιπτώσεις όπου η μεταβλητή ενεργός ισούται με 1 για το πρώτο δείγμα και όλες τις περιπτώσεις όπου αυτή η μεταβλητή ισούται με 0 για το δεύτερο δείγμα.
Πώς να χρησιμοποιήσετε μια γραφική παράσταση RQQ για να ελέγξετε την ομαλότητα των δεδομένων
Στις περισσότερες περιπτώσεις, δεν θέλετε να συγκρίνετε δύο δείγματα μεταξύ τους, αλλά συγκρίνετε ένα δείγμα με ένα θεωρητικό δείγμα που προέρχεται από μια ορισμένη κατανομή (για παράδειγμα, η κανονική κατανομή).
Για να δημιουργήσετε ένα γράφημα QQ με αυτό τον τρόπο, το R έχει την ειδική λειτουργία qqnorm (). Όπως υποδηλώνει το όνομα, αυτή η λειτουργία οριοθετεί το δείγμα σας έναντι μιας κανονικής κατανομής. Απλά δίνετε το δείγμα που θέλετε να σχεδιάσετε ως πρώτο όρισμα και προσθέστε τυχόν γραφικές παραμέτρους που σας αρέσουν.
Το R δημιουργεί ένα δείγμα με τιμές που προέρχονται από την κανονική κατανομή ή μια κανονική κατανομή με μέσο μηδέν και τυπική απόκλιση ενός. Με αυτό το δεύτερο δείγμα, το R δημιουργεί το γράφημα QQ όπως εξηγήθηκε προηγουμένως.
Το R έχει επίσης μια λειτουργία qqline (), η οποία προσθέτει μια γραμμή στο κανονικό σχέδιό σας QQ. Αυτή η γραμμή καθιστά πολύ πιο εύκολο να αξιολογήσετε αν βλέπετε μια σαφή απόκλιση από την κανονικότητα. Όσο πιο κοντά βρίσκονται όλα τα σημεία στη γραμμή, τόσο πιο κοντά γίνεται η κατανομή του δείγματος σας στην κανονική κατανομή. Η συνάρτηση qqline () παίρνει επίσης το δείγμα ως όρισμα.
Τώρα θέλετε να το κάνετε αυτό για τις θερμοκρασίες τόσο κατά την ενεργή όσο και την ανενεργή περίοδο του κάστορα. Μπορείτε να χρησιμοποιήσετε τη λειτουργία qqnorm () δύο φορές για να δημιουργήσετε και τα δύο οικόπεδα. Για τις ανενεργές περιόδους, μπορείτε να χρησιμοποιήσετε τον ακόλουθο κώδικα: >> qqnorm (beaver2 $ temp [beaver2 $ active == 0], main = "Inactive")
Μπορείτε να κάνετε το ίδιο για την ενεργή περίοδο μεταβάλλοντας την τιμή 0 σε 1.