Όταν μιλάμε για ανασχηματισμό δεδομένων στο R, είναι σημαντικό να αναγνωρίζουμε δεδομένα σε μεγάλες και μεγάλες μορφές. Αυτές οι οπτικές μεταφορές περιγράφουν δύο τρόπους να αναπαριστούν τις ίδιες πληροφορίες. Είναι χρήσιμο να γνωρίζετε αυτές τις μορφές όταν χρησιμοποιείτε R.
Μπορείτε να αναγνωρίσετε δεδομένα σε ευρεία μορφή από το γεγονός ότι οι στήλες αντιπροσωπεύουν γενικά ομάδες. Έτσι, το παράδειγμα των παιχνιδιών μπάσκετ είναι σε ευρεία μορφή, επειδή υπάρχει μια στήλη για τα καλάθια που γίνονται από καθέναν από τους συμμετέχοντες:
Παιχνίδι Τόπος Γέννησης Geraldine Gertrude 1 1η Μπριζ 12 5 11 2 2 Γάνδη 4 4 5 3 Γάνδη 5 2 6 4 4η Μπριζ 6 4 7
Αντίθετα, ρίξτε μια ματιά στο μακρύ μορφή ακριβώς των ίδιων δεδομένων:
Μεταβλητή τιμή χώρου παιχνιδιού 1 1η Μπριζ Γκρένι 12 2 2η Γάνδη Γκρένι 4 3 Γκέντ Γκάντι 5 4 4η Μπριζ Γκράνι 6 5 1η Μπριζ Γεράλνιν 5 6 2η Γάνδη Γεράλντιν 4 7 3η Γκέντ Γεράλντιν 2 8 4η Bruges Geraldine 4 9 1η Μπριζ Gertrude 11 10 2η Γάνδη Gertrude 5 11 3η Γάνδη Gertrude 6 12 4η Μπριζ Gertrude 7
Παρατηρήστε πως, σε μακρά μορφή, οι τρεις στήλες για τη Γόρνα, Geraldine και Gertrude έχουν εξαφανιστεί. Στη θέση τους, έχετε τώρα μια στήλη που ονομάζεται τιμή που περιέχει το πραγματικό σκορ και μια στήλη που ονομάζεται μεταβλητή που συνδέει τη βαθμολογία με μία από τις τρεις κυρίες.
Οι μεταβλητές αναγνωριστικού:-
αναγνωριστικό ή ID, οι μεταβλητές προσδιορίζουν τις παρατηρήσεις. Σκεφτείτε αυτά ως το κλειδί που προσδιορίζει τις παρατηρήσεις σας. (Στο σχεδιασμό βάσης δεδομένων, αυτά καλούνται πρωτεύοντα ή δευτερεύοντα κλειδιά.) Μετρημένες μεταβλητές:
-
Αυτό αντιπροσωπεύει τις μετρήσεις που παρατηρήσατε.