Βίντεο: Χρησιμοποιήστε το κατάλληλο εργαλείο του πρόσθετου Ανάλυση Δεδομένων, για να υπολογίσετε την... 2025
Για να εκτελέσετε μια ανάλυση πρόβλεψης, πρέπει να λάβετε τα δεδομένα σε μια μορφή που ο αλγόριθμος μπορεί να χρησιμοποιήσει για να δημιουργήσει ένα μοντέλο. Για να γίνει αυτό, πρέπει να αφιερώσετε λίγο χρόνο για να κατανοήσετε τα δεδομένα και να γνωρίσετε τη δομή του. Πληκτρολογήστε τη λειτουργία για να μάθετε τη δομή των δεδομένων. Εδώ είναι αυτό που μοιάζει με τα δεδομένα >> str (σπόροι). frame ': 210 obs. από 8 μεταβλητές: $ V1: num 15. 3 14. 9 14. 3 13. 8 16. 1 … $ V2: num 14. 8 14. 6 14. 1 13. 9 15 … $ V3: num 0. 871 0 881 0. 905 0. 895 0. 903 … $ V4: num 5. 76 5. 55 5. 29 5. 32 5. 66 … $ V5: num 3. 31 3. 33 3. 34 3. 38 3. 56 … $ V6: αριθμός 2. 22 1. 02 2. 7 2. 26 1. 35 … $ V7: αριθμός 5. 22 4. 96 4. 83 4. 8 5. 17 … $ V8: int 1 1 1 1 1 1 1 1 1 1 …
Από την εξέταση της δομής, μπορείτε να πείτε ότι τα δεδομένα χρειάζονται ένα βήμα προεπεξεργασίας και ένα βήμα ευκολίας:
-
Αυτό δεν είναι απολύτως απαραίτητο, αλλά για τους σκοπούς αυτού του παραδείγματος, είναι πιο βολικό να χρησιμοποιείτε ονόματα στηλών που μπορείτε να καταλάβετε και να θυμάστε. Αλλαγή του χαρακτηριστικού με κατηγορίες τιμών σε παράγοντα.
-
Η ετικέτα έχει τρεις πιθανές κατηγορίες. Για να μετονομάσετε τις στήλες, πληκτρολογήστε τον ακόλουθο κώδικα:
σπόροι <-
c ("περιοχή", "περίμετρος" ασυμμετρία "," length2 "," seedType ")Στη συνέχεια, αλλάξτε το χαρακτηριστικό που έχει κατηγορικές τιμές σε έναν παράγοντα. Ο παρακάτω κώδικας αλλάζει τον τύπο δεδομένων σε έναν παράγοντα:
