Βίντεο: Forget what you know | Jacob Barnett | TEDxTeen 2024
Στον τομέα των στατιστικών, η δυνατότητα διάκρισης μεταξύ των μεταβλητών διαφορετικοί τύποι είναι πολύ σημαντικός. Ο τύπος δεδομένων καθορίζει πολύ συχνά τον τύπο της ανάλυσης που μπορεί να εκτελεστεί. Ως αποτέλεσμα, η R προσφέρει τη δυνατότητα να ταξινομήσει ρητά τα δεδομένα ως εξής:
-
Ονομαστικά δεδομένα: Αυτός ο τύπος δεδομένων, που αντιπροσωπεύετε στη R χρησιμοποιώντας παράγοντες, διακρίνει διαφορετικές κατηγορίες, αλλά δεν υπάρχει σιωπηρή σειρά μεταξύ κατηγοριών. Παραδείγματα ονομαστικών δεδομένων είναι τα χρώματα (κόκκινο, πράσινο, μπλε), φύλο (αρσενικό, θηλυκό) και εθνικότητα (αγγλικά, γαλλικά, ιαπωνικά).
-
Δεδομένα σειράς: Τα κανονικά δεδομένα διακρίνονται από το γεγονός ότι υπάρχει κάποιο είδος φυσικής τάξης μεταξύ των στοιχείων, αλλά καμία ένδειξη της σχετικής διαφοράς μεγέθους. Οποιοδήποτε είδος δεδομένων που είναι δυνατό να ταξινομηθεί σε τάξη αλλά δεν δίνει ακριβείς τιμές είναι κανονικό. Για παράδειγμα, τα χαμηλά μεσαία υψηλά περιγράφουν δεδομένα που διατίθενται με τρία επίπεδα.
Στην έρευνα αγοράς, είναι πολύ συνηθισμένο να χρησιμοποιούμε μια κλίμακα πέντε σημείων για να μετράμε τις αντιλήψεις: διαφωνώ έντονα <διαφωνώ <ουδέτερο <συμφωνώ <συμφωνώ σθεναρά. Αυτό είναι επίσης παράδειγμα κανονικών δεδομένων.
Ένα άλλο παράδειγμα είναι η χρήση των ονομάτων των χρωμάτων για να υποδεικνύεται η σειρά, όπως κόκκινο <πορτοκαλί <πράσινο για την ένδειξη της κατάστασης του έργου.
Στο R, χρησιμοποιείτε συντεταγμένους παράγοντες για να περιγράψετε τα κανονικά δεδομένα.
-
Αριθμητικά δεδομένα: Έχετε αριθμητικά δεδομένα όταν μπορείτε να περιγράψετε τα δεδομένα σας με αριθμούς (για παράδειγμα, μήκος, βάρος ή μέτρηση). Τα αριθμητικά δεδομένα έχουν δύο υποκατηγορίες.
-
Δεδομένα με κλιμάκωση διαστήματος: Διαθέτετε κλιμακωτά δεδομένα διαστήματος όταν το διάστημα μεταξύ γειτονικών μονάδων μέτρησης είναι το ίδιο, αλλά το μηδέν είναι αυθαίρετο. Ένα καθημερινό παράδειγμα διαβαθμισμένων δεδομένων διαστήματος είναι το ημερολογιακό μας σύστημα. Κάθε χρόνο έχει το ίδιο μήκος, αλλά το μηδέν είναι αυθαίρετο. Με άλλα λόγια, ο χρόνος δεν ξεκίνησε στο έτος μηδέν - χρησιμοποιήστε απλά ένα βολικό έτος για να αρχίσετε να μετράτε. Αυτό σημαίνει ότι μπορείτε να προσθέσετε και να αφαιρέσετε ημερομηνίες (και όλους τους άλλους τύπους δεδομένων κλιμακωτών διαστημάτων), αλλά δεν μπορείτε να διαιρέσετε με νόημα τις ημερομηνίες. Άλλα παραδείγματα περιλαμβάνουν γεωγραφικό μήκος, καθώς και οτιδήποτε άλλο, όπου μπορεί να υπάρχει διαφωνία σχετικά με το πού είναι το σημείο εκκίνησης.
Άλλα παραδείγματα διαβαθμισμένων δεδομένων διαστήματος μπορούν να βρεθούν στην έρευνα των κοινωνικών επιστημών, όπως η έρευνα αγοράς.
Στο R μπορείτε να χρησιμοποιήσετε αντικείμενα ακέραια ή αριθμητικά για να αναπαριστάτε κλιμακωτά δεδομένα διαστήματος.
-
Δεδομένα κλιμακωτά: Αυτά είναι δεδομένα όπου επιτρέπονται όλα τα είδη των μαθηματικών πράξεων, ιδιαίτερα η δυνατότητα πολλαπλασιασμού και διαίρεσης (με άλλα λόγια, λήψη αναλογιών).Τα περισσότερα δεδομένα στις φυσικές επιστήμες είναι αναλογίες κλίμακας - για παράδειγμα, το μήκος, τη μάζα και την ταχύτητα. Στο R, χρησιμοποιείτε αντικείμενα αριθμητικά για να αναπαριστάτε δεδομένα κλίμακας αναλογίας.
-