Βίντεο: My Minecraft Sheep is Cancelled - Part 14 2024
Η συνάρτηση cor () του R μπορεί να αντιμετωπίσει τις ελλείπουσες τιμές δεδομένων με πολλούς τρόπους. Για αυτό, ρυθμίζετε τη χρήση του επιχειρήματος σε μία από τις πιθανές τιμές κειμένου. Η τιμή για το όρισμα χρήσης είναι ιδιαίτερα σημαντική αν υπολογίσετε τις συσχετίσεις των μεταβλητών σε ένα πλαίσιο δεδομένων. Ρυθμίζοντας αυτό το όρισμα σε διαφορετικές τιμές, μπορείτε να
-
Χρησιμοποιήστε όλες τις παρατηρήσεις θέτοντας use = 'everything' . Αυτό σημαίνει ότι εάν υπάρχει κάποια τιμή NA σε μία από τις μεταβλητές, η προκύπτουσα συσχέτιση είναι και NA. Αυτή είναι η προεπιλογή.
-
Εξαίρεση όλων των παρατηρήσεων που έχουν NA για τουλάχιστον μία μεταβλητή. Για αυτό, ορίσατε τη χρήση = 'ολοκληρώστε. obs '. Σημειώστε ότι αυτό μπορεί να σας αφήσει με λίγες μόνο παρατηρήσεις εάν οι ελλείπουσες τιμές διαδίδονται μέσω του πλήρους συνόλου δεδομένων.
-
Εξαιρέστε τις παρατηρήσεις με τιμές NA για κάθε ζεύγος μεταβλητών που εξετάζετε. Για αυτό, ρυθμίζετε το argument use = 'pairwise'. Αυτό εξασφαλίζει ότι μπορείτε να υπολογίσετε τη συσχέτιση για κάθε ζεύγος μεταβλητών χωρίς να χάσετε πληροφορίες λόγω έλλειψης τιμών στις άλλες μεταβλητές.
Στην πραγματικότητα, μπορείτε να υπολογίσετε διαφορετικά μέτρα συσχέτισης. Από προεπιλογή, το R υπολογίζει τον κανονικό συντελεστή συσχέτισης Pearson. Για δεδομένα που δεν διανέμονται κανονικά, μπορείτε να χρησιμοποιήσετε τη συνάρτηση cor () για να υπολογίσετε τη συσχέτιση Spearman rank ή το tau της Kendall. Για αυτό, πρέπει να ορίσετε το παράθυρο μεθόδου στην κατάλληλη τιμή.