Βίντεο: The Enormous Radio / Lovers, Villains and Fools / The Little Prince 2024
Πιθανώς τα πιο συνηθισμένα λάθη στο R γίνονται κατά την ανάγνωση σε δεδομένα από αρχεία κειμένου χρησιμοποιώντας ανάγνωση. πίνακα () ή να διαβάσετε. csv (). Πολλά λάθη οδηγούν σε σφάλματα R, αλλά μερικές φορές μόνο παρατηρείτε ότι κάτι πήγε στραβά όταν εξετάζετε τη δομή των δεδομένων σας. Στην τελευταία περίπτωση, συχνά διαπιστώνετε ότι ορισμένες ή όλες οι μεταβλητές μετατρέπονται σε παράγοντες όταν δεν πρέπει να είναι πραγματικά.
Όταν το R παρουσιάζει σφάλματα ή η δομή των δεδομένων σας δεν είναι αυτό που νομίζετε ότι πρέπει να είναι, ελέγξτε τα εξής:
-
Ξεχάσατε να καθορίσετε το όρισμα header = TRUE ; Αν ναι, το R θα βλέπει τα ονόματα των στηλών ως τιμές και ως εκ τούτου θα μετατρέπει κάθε μεταβλητή σε παράγοντα, όπως συμβαίνει πάντοτε με τα δεδομένα χαρακτήρων σε ένα αρχείο κειμένου.
-
Έχετε κενά στα ονόματα ή στα στοιχεία της στήλης σας; Η ανάγνωση. η συνάρτηση πίνακα () μπορεί να ερμηνεύσει διαστήματα σε, για παράδειγμα, ονόματα στηλών ή σε δεδομένα στοιχειοσειρών ως διαχωριστικό. Στη συνέχεια, λάβετε σφάλματα που σας λένε ότι η γραμμή x δεν είχε στοιχεία y.
-
Έχετε διαφορετικό δεκαδικό διαχωριστή; Σε ορισμένες χώρες, τα δεκαδικά ψηφία διαχωρίζονται με κόμμα. Πρέπει να πείτε ρητά ότι αυτή είναι η περίπτωση χρησιμοποιώντας το argument dec = "," κατά την ανάγνωση. λειτουργία πίνακα ().
-
Ξεχάσατε να ορίσετε stringSfactors = FALSE ; Από προεπιλογή, το R μεταβάλλει τα δεδομένα χαρακτήρων σε παράγοντες, οπότε πρέπει πάντα να προσθέσετε αυτό το όρισμα αν θέλετε τα δεδομένα σας να παραμείνουν μεταβλητές χαρακτήρα.
-
Έχετε έναν άλλο τρόπο προσδιορισμού των ελλειπουσών τιμών; Το R διαβάζει το "NA" σε ένα αρχείο κειμένου ως τιμή που λείπει, αλλά το αρχείο μπορεί να χρησιμοποιήσει έναν διαφορετικό κωδικό (για παράδειγμα, "λείπει"). Το R θα το δει ως κείμενο και θα μετατρέψει εκ νέου τη μεταβλητή σε παράγοντα. Μπορείτε να λύσετε αυτό καθορίζοντας το επιχείρημα na. χορδές στη διαβάσει. λειτουργία πίνακα ().
Αν ελέγχετε πάντα τη δομή των δεδομένων σας αμέσως μετά την ανάγνωση, μπορείτε να πιάσετε λάθη πολύ νωρίτερα και να αποφύγετε ώρες απογοήτευσης. Το καλύτερο στοίχημά σας είναι να χρησιμοποιήσετε το str () για πληροφορίες σχετικά με τους τύπους και το κεφάλι () για να δείτε αν οι τιμές είναι αυτό που περιμένατε.