Βίντεο: Cloud Computing - Computer Science for Business Leaders 2016 2024
Όταν έχετε δεδομένα σε υψηλή μορφή στο R, μπορείτε εύκολα να χρησιμοποιήσετε γραφικά πλέγματος για να απεικονίσετε υποομάδες στα δεδομένα σας. Για παράδειγμα, τι συμβαίνει όταν θέλετε να αναλύσετε ταυτόχρονα περισσότερες από μία μεταβλητές;
Εξετάστε το ενσωματωμένο σύνολο δεδομένων longley, το οποίο περιέχει δεδομένα σχετικά με την απασχόληση, την ανεργία και άλλους δείκτες πληθυσμού: δεδομένα >> str (longley). frame ': 16 obs. από 7 μεταβλητές: $ ΑΕΠ. αποπληθωριστής: num 83 88. 5 88. 2 89. 5 96. 2 … $ ΑΕΠ: num 234 259 258 285 329 … $ Άνεργοι: num 236 232 368 335 210 … $ Ενόπλων. Δυνάμεις: num 159 146 162 165 310 … $ Πληθυσμός: num 108 109 110 111 112 … $ Έτος: int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 … $ Απασχολούμενοι: num 60. 3 61. 1 60. 2 61. 2 63. 2 …
Ένας τρόπος για να αναλύσετε εύκολα τις διάφορες μεταβλητές ενός πλαισίου δεδομένων είναι να αναδιαμορφώσετε αρχικά το πλαίσιο δεδομένων από ευρεία μορφή σε ψηλή μορφή.
Ένας εύκολος τρόπος για να αναμορφώσετε ένα πλαίσιο δεδομένων από ευρεία μορφή σε υψηλή μορφή είναι να χρησιμοποιήσετε τη λειτουργία τήξης () στο πακέτο reshape2.
Να θυμάστε: Η reshape2 δεν είναι μέρος της βάσης R - είναι ένα πρόσθετο πακέτο που είναι διαθέσιμο στο CRAN. Μπορείτε να το εγκαταστήσετε με την εγκατάσταση. πακέτα ("reshape2").
Τώρα μπορείτε να σχεδιάσετε το υψηλό πλαίσιο δεδομένων mlongley και να χρησιμοποιήσετε την τιμή και τη μεταβλητή των νέων στηλών στην τιμή του τύπου ~ Year | μεταβλητός. >> xyplot (τιμή ~ Έτος | μεταβλητή, δεδομένα = mlongley, + διάταξη = γ (6, 1), + παρ. Ταινία. 7) +)
Τα πρόσθετα επιχειρήματα par. λωρίδα. το κείμενο και οι κλίμακες ελέγχουν το μέγεθος της γραμματοσειράς (λόγος επέκτασης χαρακτήρων) της λωρίδας στο πάνω μέρος του γραφήματος, καθώς και την κλίμακα.
Όταν δημιουργείτε οικόπεδα με πολλαπλές ομάδες, βεβαιωθείτε ότι η προκύπτουσα οικόπεδο έχει νόημα. Για παράδειγμα, η μονάδα ΑΕΠ (σύντομη για
Ακαθάριστο Εθνικό Προϊόν) είναι πιθανώς δισεκατομμύρια δολάρια. Αντίθετα, η μονάδα του πληθυσμού είναι μάλλον εκατομμύρια άνθρωποι. (Η τεκμηρίωση του συνόλου δεδομένων Longley δεν είναι σαφής σε αυτό το θέμα.) Να είστε πολύ προσεκτικοί όταν παρουσιάζετε διαγράμματα όπως αυτό - δεν θέλετε να κατηγορήσετε ότι δημιουργείτε σκουπίδια
(παραπλανητικά γραφικά).