Βίντεο: Disruption - Day 2 - Part 1 (ENG) 2024
Πριν από κάθε είδους στατιστική ανάλυση, είναι απαραίτητη η κατανόηση της φύσης των δεδομένων που αναλύονται. Μπορείτε να χρησιμοποιήσετε τον EDA για να προσδιορίσετε τις ιδιότητες ενός συνόλου δεδομένων για να καθορίσετε τις καταλληλότερες στατιστικές μεθόδους που θα εφαρμοστούν στα δεδομένα. Μπορείτε να διερευνήσετε διάφορους τύπους ιδιοτήτων με τεχνικές EDA, συμπεριλαμβανομένων των παρακάτω:
-
Το κέντρο των δεδομένων
-
Η εξάπλωση μεταξύ των μελών των δεδομένων
-
Η υστέρηση των δεδομένων
-
Η κατανομή πιθανοτήτων
-
Η συσχέτιση μεταξύ των στοιχείων στο σύνολο δεδομένων
-
Είτε οι παράμετροι των δεδομένων είναι σταθερές με την πάροδο του χρόνου < Η ύπαρξη υπερβολικών τιμών στα δεδομένα
-
Μια άλλη βασική ερώτηση Η απάντηση του EDA είναι: "Τα δεδομένα συμμορφώνονται με τις υποθέσεις μας; "Ο προσδιορισμός των ιδιοτήτων ενός συνόλου δεδομένων είναι πολύ σημαντικός, επειδή πολλές στατιστικές διαδικασίες είναι ευαίσθητες στις υποθέσεις που κάνετε σχετικά με τα δεδομένα.