Βίντεο: I'm Positive 2019 | An open discussion on HIV 2024
Όταν εργάζεστε με μεγάλα στατιστικά δεδομένα, προσδιορίζετε την εξάπλωση ενός συνόλου δεδομένων από το κέντρο με διάφορα διαφορετικά συνοπτικά μέτρα: απόκλιση, τεταρτημόρια, περιοχή διακαρυτίτη (IQR).
Η απόκλιση είναι η μέση τετραγωνική απόκλιση μεταξύ των στοιχείων του συνόλου δεδομένων και του μέσου όρου. Για ένα δείγμα δεδομένων, η διακύμανση υπολογίζεται όπως παρακάτω:
όπου
-
x i είναι η τιμή ενός μόνο στοιχείου στο δείγμα.
-
είναι ο μέσος όρος του δείγματος.
-
n είναι το μέγεθος του δείγματος.
Η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης. Για τις περισσότερες εφαρμογές, η τυπική απόκλιση είναι πιο εύκολη στη χρήση από τη διακύμανση ως μέτρο διάδοσης. Αυτό οφείλεται στο ότι η διακύμανση μετράται σε μονάδες τετραγώνων , ενώ η τυπική απόκλιση μετράται στις ίδιες μονάδες με τα δεδομένα. Για παράδειγμα, η διακύμανση ενός συνόλου δεδομένων που αποτελείται από τιμές θα μετράται σε δολάρια τετράγωνο, και η τυπική απόκλιση θα μετράται σε δολάρια. Η τυπική απόκλιση είναι το πιο ευρέως χρησιμοποιούμενο μέτρο της εξάπλωσης σε ένα σύνολο δεδομένων.
Τα τεταρτημόρια χωρίζουν ένα σύνολο δεδομένων σε τέσσερα ίσα μέρη. Το πρώτο τεταρτημόριο (Q 1 ) διαιρεί τα δεδομένα στο χαμηλότερο 25% των παρατηρήσεων και στο υψηλότερο 75% (25% των παρατηρήσεων είναι και το 75% είναι μεγαλύτερο από Q 1 ). Το δεύτερο τεταρτημόριο (Q 2 ) χωρίζει τα δεδομένα στο χαμηλότερο 50% των παρατηρήσεων και στο υψηλότερο 50%. Το τρίτο τέταρτο (Q 3 ) χωρίζει τα δεδομένα στο χαμηλότερο 75% των παρατηρήσεων και στο υψηλότερο 25%. Το εύρος μεταξύ τεταρτημορίων (IQR) ισούται με τη διαφορά μεταξύ του τρίτου και του πρώτου τεταρτημορίου:
Το παρακάτω σχήμα απεικονίζει μια γραφική παράσταση κουτιού των ημερήσιων αποδόσεων στο ExxonMobil το 2013. Πλαίσιο γραφικών ημερησίως επιστρέφει στο απόθεμα ExxonMobil το 2013. Η γραφική παράσταση του κουτιού παρουσιάζει αρκετά βασικά στατιστικά στοιχεία για τις αποδόσεις του ExxonMobil: > Η ελάχιστη απόδοση εμφανίζεται σε ένα γράφημα ως ένα μοναδικό σημείο στο κάτω μέρος της γραφικής παράστασης (ένα γράφημα πλαισίου εμφανίζει
ακροδεκτώνως μεμονωμένα σημεία). Το Q
1 εμφανίζεται ως το κάτω μέρος του κουτιού, Q 2 είναι η συμπαγής μαύρη γραμμή στο κέντρο του κιβωτίου και το Q 3 το κιβώτιο. Η μέγιστη απόδοση εμφανίζεται ως ένα μόνο σημείο στο πάνω μέρος της γραφικής παράστασης.