Πίνακας περιεχομένων:
Βίντεο: Data Analysis in R by Dustin Tran 2024
Το κείμενο στο R αντιπροσωπεύεται από διανύσματα χαρακτήρα. Ένα διάνυσμα χαρακτήρων είναι - το μαντέψατε! - ένα διάνυσμα που αποτελείται από χαρακτήρες.
Στον κόσμο του προγραμματισμού υπολογιστών, το κείμενο συχνά αναφέρεται ως συμβολοσειρά. Εδώ η λέξη κείμενο αναφέρεται σε ένα μόνο στοιχείο ενός διανύσματος, αλλά θα πρέπει να γνωρίζετε ότι τα αρχεία βοήθειας R μερικές φορές αναφέρονται σε χορδές και μερικές φορές σε κείμενο. Σημαίνουν το ίδιο πράγμα.
Ρίξτε μια ματιά στο πώς ο R χρησιμοποιεί διανύσματα χαρακτήρων για να αναπαριστά το κείμενο. Μπορείτε να αντιστοιχίσετε κάποιο κείμενο σε ένα διάνυσμα χαρακτήρων και να το αποκτήσετε για να εξαγάγετε υποσύνολα αυτών των δεδομένων. Μπορείτε επίσης να εξοικειωθείτε με την πολύ ισχυρή έννοια των ονομάτων, διανύσματα στα οποία κάθε στοιχείο έχει ένα όνομα. Αυτό είναι χρήσιμο, επειδή μπορείτε στη συνέχεια να ανατρέξετε στα στοιχεία με το όνομα και τη θέση.
Αντιστοιχίστε μια τιμή σε ένα διάνυσμα χαρακτήρων
Μπορείτε να αντιστοιχίσετε μια τιμή σε ένα διάνυσμα χαρακτήρων χρησιμοποιώντας τον χειριστή εκχώρησης (<-), όπως κάνετε για όλες τις άλλες μεταβλητές. Ελέγχετε αν μια μεταβλητή έχει χαρακτήρα κλάσης, για παράδειγμα, χρησιμοποιώντας την ετικέτα is. χαρακτήρα () λειτουργεί ως εξής: >> x είναι. (x) TRUE
Σημειώστε ότι το x είναι ένα διάνυσμα χαρακτήρων μήκους 1. Για να μάθετε πόσα χαρακτήρες υπάρχουν στο κείμενο, χρησιμοποιήστε nchar:
Η συνάρτηση αυτή σας λέει ότι το x έχει μήκος 1 και ότι το μόνο στοιχείο στο x έχει 12 χαρακτήρες.
Δημιουργήστε ένα διάνυσμα χαρακτήρων με περισσότερα από ένα στοιχεία
Για να δημιουργήσετε ένα διάνυσμα χαρακτήρων με περισσότερα από ένα στοιχεία, χρησιμοποιήστε τη συνάρτηση συνδυασμού c ():
x μήκος (x) [1] 2> nchar x) [1] 5 6
Παρατηρήστε ότι αυτή τη φορά το R σας λέει ότι το διάνυσμα σας έχει μήκος 2 και ότι το πρώτο στοιχείο έχει πέντε χαρακτήρες και το δεύτερο στοιχείο έχει έξι χαρακτήρες.