Βίντεο: Εισαγωγή δεδομένων από αρχεία Excel και παραδείγματα περιγραφικής στατιστικής ανάλυσης με την R 2024
Αν ρωτάς τους χρήστες του R ποιος είναι ο καλύτερος τρόπος να εισάγεις δεδομένα απευθείας από το Microsoft Excel, οι περισσότεροι από αυτούς θα απαντήσει πιθανώς ότι η καλύτερη επιλογή σας είναι να εξαγάγετε πρώτα από το Excel σε ένα αρχείο CSV και στη συνέχεια να χρησιμοποιήσετε την ανάγνωση. csv () για να εισαγάγετε τα δεδομένα σας σε R.
Στην πραγματικότητα, αυτό εξακολουθεί να είναι η συμβουλή στο Κεφάλαιο 8 του εγχειριδίου εισαγωγής και εξαγωγής R, το οποίο λέει, "Η πρώτη συμβουλή είναι να αποφύγετε αυτό αν είναι δυνατόν! "Ο λόγος είναι ότι πολλές από τις υπάρχουσες μεθόδους εισαγωγής δεδομένων από το Excel εξαρτώνται από το λογισμικό ή τις βιβλιοθήκες τρίτων που μπορεί να είναι δύσκολο να ρυθμιστούν, δεν είναι διαθέσιμα σε όλα τα λειτουργικά συστήματα ή ίσως να έχουν περιοριστικούς όρους αδειοδότησης.
Ωστόσο, από τον Φεβρουάριο του 2011 υπάρχει μια νέα εναλλακτική λύση: χρησιμοποιώντας το πακέτο XLConnect, το οποίο διατίθεται από το CRAN. Αυτό που κάνει το XLConnect διαφορετικό είναι ότι χρησιμοποιεί μια βιβλιοθήκη Java για να διαβάζει και να γράφει αρχεία του Excel. Αυτό έχει δύο πλεονεκτήματα:
-
Λειτουργεί σε όλα τα λειτουργικά συστήματα που υποστηρίζουν την Java. Το XLConnect είναι γραμμένο σε Java και εκτελείται σε Window, Linux και Mac OS.
-
Δεν υπάρχει τίποτα άλλο για φόρτωση. Το XLConnect δεν απαιτεί άλλες βιβλιοθήκες ή λογισμικό. Αν έχετε εγκαταστήσει Java, θα πρέπει να λειτουργήσει.
Το XLConnect μπορεί επίσης να γράψει αρχεία του Excel, συμπεριλαμβανομένης της αλλαγής της μορφοποίησης κυττάρων, τόσο σε μορφή Excel 97-2003 όσο και σε μορφή Excel 2007/10.
Για να μάθετε περισσότερα σχετικά με το XLConnect, μπορείτε να διαβάσετε την εξαιρετική επωνυμία πακέτου.
Έως τώρα πιθανότατα έχετε φαγούρα για να ξεκινήσετε με ένα παράδειγμα. Ας υποθέσουμε ότι θέλετε να διαβάσετε ένα υπολογιστικό φύλλο Excel στον κατάλογο χρηστών που ονομάζεται Elements. xlsx. Αρχικά, εγκαταστήστε και τοποθετήστε τη συσκευασία. στη συνέχεια, δημιουργήστε ένα αντικείμενο με το όνομα αρχείου:
Τώρα είστε έτοιμοι να διαβάσετε ένα φύλλο αυτού του βιβλίου εργασίας με τη λειτουργία readWorksheetFromFile (). Θα πρέπει να περάσετε τουλάχιστον δύο επιχειρήματα:
αρχείο
-
: Μια συμβολοσειρά χαρακτήρων με μια διαδρομή προς μια έγκυρη. xls ή. xlsx αρχείο φύλλο
-
: Είτε ένας ακέραιος αριθμός που δηλώνει τη θέση του φύλλου εργασίας (για παράδειγμα φύλλο = 1) ή το όνομα του φύλλου εργασίας (για παράδειγμα, φύλλο = "Φύλλο2") ακολουθώντας δύο γραμμές κάνουν ακριβώς το ίδιο πράγμα - και οι δύο εισάγουν τα δεδομένα στο πρώτο φύλλο εργασίας (που ονομάζεται Φύλλο1):
στοιχεία στοιχείων <- readWorksheetFromFile (excel αρχείο, φύλλο = "Φύλλο1")