Πίνακας περιεχομένων:
- Τα πιο χρησιμοποιούμενα ποσοτικά είναι στην πραγματικότητα τα ποσοστά 0 και 100 τοις εκατό. Θα μπορούσατε να τους ονομάσετε το ελάχιστο και το μέγιστο, γιατί αυτό είναι που είναι. Μπορείτε να πάρετε μαζί τις λειτουργίες min () και max () μαζί με τη λειτουργία range (). Αυτή η λειτουργία σας παρέχει βολικά την περιοχή των δεδομένων. Έτσι, για να μάθετε ανάμεσα σε ποιες δύο τιμές βρίσκονται όλα τα χιλιόμετρα, κάνετε τα εξής:
- τεταρτημόριο
- Όλες αυτές οι λειτουργίες έχουν ένα επιχείρημα na. rm που σας επιτρέπει να αφαιρέσετε όλες τις τιμές NA πριν από τον υπολογισμό του αντίστοιχου στατιστικού στοιχείου. Εάν δεν το κάνετε αυτό, οποιοδήποτε διάνυσμα που περιέχει NA θα έχει NA ως αποτέλεσμα. Αυτό λειτουργεί όμοια με το na. rm της συνάρτησης sum ().
Βίντεο: Differential equations, studying the unsolvable | DE1 2024
Ένας μόνο αριθμός δεν σας λέει πολλά για τα δεδομένα σας. Συχνά είναι εξίσου σημαντικό να γνωρίζετε την εξάπλωση των δεδομένων σας. Μπορείτε να χρησιμοποιήσετε το R για να εξετάσετε αυτή την εξάπλωση χρησιμοποιώντας διάφορες διαφορετικές προσεγγίσεις.
Αρχικά, μπορείτε να υπολογίσετε είτε την απόκλιση είτε την τυπική απόκλιση για να συνοψίσετε τη διαφορά σε έναν μόνο αριθμό. Για αυτό, έχετε τις βολικές λειτουργίες var () για τη διακύμανση και sd () για την τυπική απόκλιση. Για παράδειγμα, υπολογίζετε την τυπική απόκλιση της μεταβλητής mpg στα αυτοκίνητα πλαισίου δεδομένων όπως αυτή:
Δίπλα στο μέσο και την παραλλαγή, μπορείτε επίσης να ρίξετε μια ματιά στα ποσοτικά. Ένα
quantile, ή το εκατοστημόριο, σας λέει πόσα από τα δεδομένα σας βρίσκονται κάτω από μια ορισμένη τιμή. Το ποσοστό ποσοστού 50%, για παράδειγμα, δεν είναι παρά το μέσο όρο. Και πάλι, το R έχει κάποιες βολικές λειτουργίες για να σας βοηθήσει στην εξέταση των ποσοστών. Πώς να υπολογίσετε το εύρος δεδομένων σε R
Τα πιο χρησιμοποιούμενα ποσοτικά είναι στην πραγματικότητα τα ποσοστά 0 και 100 τοις εκατό. Θα μπορούσατε να τους ονομάσετε το ελάχιστο και το μέγιστο, γιατί αυτό είναι που είναι. Μπορείτε να πάρετε μαζί τις λειτουργίες min () και max () μαζί με τη λειτουργία range (). Αυτή η λειτουργία σας παρέχει βολικά την περιοχή των δεδομένων. Έτσι, για να μάθετε ανάμεσα σε ποιες δύο τιμές βρίσκονται όλα τα χιλιόμετρα, κάνετε τα εξής:
> 999 >> ($ $ mpg) [1] 10. 4 33. 9
Πώς να υπολογίσετε τα τεταρτημόρια δεδομένων σε RΗ περιοχή εξακολουθεί να σας παρέχει μόνο περιορισμένες πληροφορίες. Συχνά οι στατιστικολόγοι αναφέρουν το πρώτο και το τρίτο
τεταρτημόριο
δίπλα στο εύρος και τον διάμεσο. Αυτά τα τεταρτημόρια είναι, αντίστοιχα, τα ποσοστά 25 και 75 τοις εκατό, που είναι οι αριθμοί για τους οποίους το ένα τέταρτο και τα τρία τέταρτα των δεδομένων είναι μικρότερα. Παίρνετε αυτούς τους αριθμούς χρησιμοποιώντας τη λειτουργία quantile (), όπως αυτή:
Η συνάρτηση quantile () μπορεί να σας δώσει κάθε quantile που θέλετε. Για αυτό, χρησιμοποιείτε το επιχείρημα των δειγμάτων. Δίνετε τα probs (ή πιθανότητες) ως ένα κλασματικό αριθμό. Για το 20% quantile, για παράδειγμα, χρησιμοποιείτε το 0. 20 ως επιχείρημα για την τιμή.Αυτό το επιχείρημα παίρνει επίσης ένα διάνυσμα ως τιμή, έτσι ώστε να μπορείτε να πετύχετε, για παράδειγμα, τα ποσοστά 5% και 95% όπως παρακάτω: >> quantile (αυτοκίνητα $ mpg, probs = c (0,05, 0,95)) 5% 95% 11. 995 31. 300
Η προεπιλεγμένη τιμή για το όρισμα probs είναι ένας φορέας που αντιπροσωπεύει το ελάχιστο (0), το πρώτο τεταρτημόριο (0. 25), το διάμεσο (0. 5) το τεταρτημόριο (0,75) και το μέγιστο (1).