Βίντεο: Самодельные четырехвалковые вальцы - Серия 1 2024
Μια άλλη χρήσιμη εφαρμογή υποσύνολων πλαισίων δεδομένων είναι η εύρεση και αφαίρεση σειρών με δεδομένα που λείπουν. Η λειτουργία R για να ελέγξετε για αυτό είναι πλήρης. περιπτώσεις (). Μπορείτε να το δοκιμάσετε στην ενσωματωμένη αεροπορική ποιότητα δεδομένων, ένα πλαίσιο δεδομένων με ένα σωστό ποσό δεδομένων που λείπουν: >> str (airquality)> ολοκληρώστε. περιπτώσεις (airquality)
Τα αποτελέσματα της ολοκλήρωσης. περιπτώσεις () είναι ένας λογικός φορέας με την τιμή TRUE για γραμμές που είναι πλήρεις και FALSE για γραμμές που έχουν ορισμένες τιμές NA. Για να καταργήσετε τις σειρές με δεδομένα που λείπουν από την ποιότητα του αέρα, δοκιμάστε τα εξής:
x str (x)
Το αποτέλεσμά σας θα πρέπει να είναι ένα πλαίσιο δεδομένων με 111 σειρές, αντί των 153 σειρών του αρχικού πλαισίου δεδομένων για την ποιότητα της αερογέλης.
Όπως πάντα με τον R, υπάρχουν περισσότεροι από ένας τρόπος για να πετύχετε τον στόχο σας. Σε αυτή την περίπτωση, μπορείτε να χρησιμοποιήσετε το na. omit () για να παραλείψετε όλες τις σειρές που περιέχουν τιμές NA: >> x <- na. παραλείψτε (airquality)
Όταν είστε βέβαιοι ότι τα δεδομένα σας είναι καθαρά, μπορείτε να αρχίσετε να την αναλύετε προσθέτοντας υπολογισμένα πεδία.
Εάν χρησιμοποιήσετε κάποια από αυτές τις μεθόδους για να υποδιαιρέσετε τα δεδομένα σας ή να καθαρίσετε τις ελλείπουσες τιμές, θυμηθείτε να αποθηκεύσετε το αποτέλεσμα σε ένα νέο αντικείμενο. Το R δεν αλλάζει τίποτα στο αρχικό πλαίσιο δεδομένων, εκτός αν το αντικαταστήσετε ρητά. Αυτό είναι καλό, επειδή δεν μπορείτε να χάνετε τυχαία τα δεδομένα σας.