Πίνακας περιεχομένων:
Βίντεο: Did The Past Really Happen? 2024
Εάν χρειάζεστε μια γρήγορη επισκόπηση του συνόλου δεδομένων σας, μπορείτε βεβαίως να χρησιμοποιείτε πάντοτε την εντολή R str () και εξετάστε τη δομή. Αλλά αυτό σας λέει κάτι μόνο για τις κατηγορίες των μεταβλητών σας και τον αριθμό των παρατηρήσεων. Επίσης, η κεφαλή λειτουργίας () σας δίνει, στην καλύτερη περίπτωση, μια ιδέα για τον τρόπο αποθήκευσης των δεδομένων στο σύνολο δεδομένων.
Για να πάρετε μια καλύτερη εικόνα της διανομής των μεταβλητών σας στο σύνολο δεδομένων, μπορείτε να χρησιμοποιήσετε τη λειτουργία summary () όπως αυτή:
Αριθμητικές μεταβλητές:
η περίληψη () σας δίνει το εύρος, τα τεταρτημόρια, το διάμεσο και το μέσο όρο.Μεταβλητές παράγοντα:
-
η περίληψη () σας δίνει έναν πίνακα με συχνότητες. Αριθμητικές και μεταβλητές παράγοντα:
-
περίληψη () σας δίνει τον αριθμό των ελλειπουσών τιμών, εάν υπάρχουν.
-
Οι μεταβλητές χαρακτήρων: η περίληψη () δεν σας δίνει καθόλου πληροφορίες εκτός από το μήκος και την κλάση (που είναι "χαρακτήρας").
Πώς να διορθώσετε ένα πρόβλημα -
Βλέπετε τις παράξενες τιμές για τη μεταβλητή cyl; Μια γρήγορη ματιά στη συνοπτική παρουσίαση μπορεί να σας πει ότι υπάρχει κάτι το ψαρά, όπως για παράδειγμα το ελάχιστο και το πρώτο τέταρτο έχουν ακριβώς την ίδια αξία. Στην πραγματικότητα, η μεταβλητή cyl έχει μόνο τρεις τιμές και θα ήταν καλύτερα ως παράγοντας. Ας το βάλουμε από τη δυστυχία: >> αυτοκίνητα $ cyl <- as. παράγοντας (αυτοκίνητα $ cyl)