Πίνακας περιεχομένων:
- Πώς να χρησιμοποιήσετε πίνακες απεικονίσεις για την πρόβλεψη της ανάλυσης
- Χρήση των γραφημάτων σε προγνωστική ανάλυση
- Βασικά διαγράμματα πίτας για προγνωστική ανάλυση
- Πώς να χρησιμοποιήσετε γραφήματα γραφικών για την πρόβλεψη της ανάλυσης
- Βασικά σύννεφα λέξεων για ανάλυση πρόβλεψης
- Πώς να χρησιμοποιήσετε την αναπαράσταση των πτηνών για την πρόβλεψη
Βίντεο: Αφθονία.mp4 2024
Μια εικόνα αξίζει χίλιες λέξεις - ειδικά όταν προσπαθείτε να πάρετε μια καλή λαβή στα δεδομένα πρόβλεψης ανάλυσης. Στο στάδιο της προεπεξεργασίας, ενώ προετοιμάζετε τα δεδομένα σας, είναι συνηθισμένη η πρακτική να απεικονίζετε τι έχετε στο χέρι πριν προχωρήσετε στο επόμενο βήμα.
Ξεκινάτε χρησιμοποιώντας ένα υπολογιστικό φύλλο όπως το Microsoft Excel για να δημιουργήσετε ένα πίνακα δεδομένων - το οποίο αποτελείται από χαρακτηριστικά υποψήφιων δεδομένων (που αναφέρονται επίσης ως χαρακτηριστικά ). Αρκετά πακέτα λογισμικού επιχειρηματικής ευφυΐας (όπως το Tableau) μπορούν να σας δώσουν μια προκαταρκτική επισκόπηση των δεδομένων στα οποία πρόκειται να εφαρμόσετε τα αναλυτικά στοιχεία.
Πώς να χρησιμοποιήσετε πίνακες απεικονίσεις για την πρόβλεψη της ανάλυσης
Οι πίνακες είναι η απλούστερη, πιο βασική απεικόνιση των δεδομένων. Οι πίνακες (επίσης γνωστοί ως υπολογιστικά φύλλα ) αποτελούνται από γραμμές και στήλες - οι οποίες αντιστοιχούν, αντίστοιχα, στα αντικείμενα και τα χαρακτηριστικά τους που αναφέρθηκαν προηγουμένως ως συντάσσοντας τα δεδομένα σας. Για παράδειγμα, εξετάστε τα δεδομένα του διαδικτυακού κοινωνικού δικτύου. Ένα αντικείμενο δεδομένων θα μπορούσε να αντιπροσωπεύει έναν χρήστη. Χαρακτηριστικά ενός χρήστη (αντικείμενο δεδομένων) μπορεί να είναι επικεφαλίδες των στηλών: Φύλο, ταχυδρομικός κώδικας ή Ημερομηνία γέννησης.
Τα κελιά σε έναν πίνακα αντιπροσωπεύουν τιμές. Η απεικόνιση σε πίνακες μπορεί να σας βοηθήσει να εντοπίσετε εύκολα τις τιμές χαρακτηριστικών που λείπουν από αντικείμενα δεδομένων.
Οι πίνακες μπορούν επίσης να παρέχουν την ευελιξία προσθήκης νέων χαρακτηριστικών που είναι συνδυασμοί άλλων χαρακτηριστικών. Για παράδειγμα, στα δεδομένα κοινωνικού δικτύου, μπορείτε να προσθέσετε μια άλλη στήλη με την ονομασία Age, η οποία μπορεί εύκολα να υπολογιστεί - ως παράγωγο χαρακτηριστικό - από το υπάρχον χαρακτηριστικό της ημερομηνίας γέννησης. Τα δεδομένα πίνακα δεδομένων κοινωνικού δικτύου εμφανίζουν μια νέα στήλη, Ηλικία, που δημιουργήθηκε από μια άλλη υπάρχουσα στήλη (Ημερομηνία Γέννησης).
Χρήση των γραφημάτων σε προγνωστική ανάλυση
Οι χάρτες γραμμών μπορούν να χρησιμοποιηθούν για να εντοπίσουν αιχμές ή ανωμαλίες στα δεδομένα σας. Μπορείτε να το χρησιμοποιήσετε για κάθε χαρακτηριστικό για να δείτε γρήγορα τις ελάχιστες και τις μέγιστες τιμές. Οι διαγράμματα bar μπορούν επίσης να χρησιμοποιηθούν για να ξεκινήσετε μια συζήτηση για τον τρόπο ομαλοποίησης των δεδομένων σας.
Η κανονικοποίηση είναι η προσαρμογή ορισμένων ή όλων των χαρακτηριστικών τιμών σε κλίμακα που καθιστά τα δεδομένα πιο εύχρηστα. Για παράδειγμα, μπορείτε να δείτε εύκολα ότι υπάρχει ένα σφάλμα στα δεδομένα: Η γραμμή Ηλικία σε ένα αρχείο είναι αρνητική. Αυτή η ανωμαλία απεικονίζεται ευκολότερα από ένα διάγραμμα ράβδων παρά από έναν πίνακα δεδομένων.
Βασικά διαγράμματα πίτας για προγνωστική ανάλυση
Τα διαγράμματα πίτας χρησιμοποιούνται κυρίως για την εμφάνιση ποσοστών. Μπορούν εύκολα να απεικονίσουν τη διανομή πολλών αντικειμένων και να τονίσουν τα πιο κυρίαρχα. Τα ακατέργαστα δεδομένα του κοινωνικού δικτύου αντιπροσωπεύονται σύμφωνα με την ιδιότητα Age.Παρατηρήστε ότι το διάγραμμα δείχνει όχι μόνο μια σαφή κατανομή των αρσενικών έναντι των θηλυκών αλλά και ένα πιθανό σφάλμα: R ως τιμή για τον τύπο φύλου που πιθανώς δημιουργήθηκε κατά τη συλλογή των δεδομένων.
Πώς να χρησιμοποιήσετε γραφήματα γραφικών για την πρόβλεψη της ανάλυσης
Η θεωρία γραφημάτων παρέχει ένα σύνολο ισχυρών αλγορίθμων που μπορούν να αναλύσουν δεδομένα δομημένα και αναπαριστώμενα ως γράφημα. Στην επιστήμη των υπολογιστών, ένα γράφημα είναι η δομή δεδομένων, ένας τρόπος να οργανωθούν τα δεδομένα που αντιπροσωπεύουν τις σχέσεις μεταξύ ζευγών αντικειμένων δεδομένων. Ένα γράφημα αποτελείται από δύο βασικά μέρη:
-
Άκρες που είναι επίσης γνωστές ως κόμβοι
-
Οι άκρες που συνδέουν ζεύγη κόμβων
Οι άκρες μπορούν να κατευθύνονται (σύρονται σαν βέλη) και μπορούν να έχουν βάρη. Μπορείτε να αποφασίσετε να τοποθετήσετε μια άκρη (βέλος) μεταξύ δύο κόμβων (κύκλοι) - στην περίπτωση αυτή, τα μέλη του κοινωνικού δικτύου που είναι συνδεδεμένα με άλλα μέλη ως φίλοι:
Η κατεύθυνση του βέλους υποδεικνύει ποιοι "φίλοι", ή που αρχίζει τις αλληλεπιδράσεις τις περισσότερες φορές.
Βασικά σύννεφα λέξεων για ανάλυση πρόβλεψης
Εξετάστε μια λίστα λέξεων ή εννοιών που ορίζονται ως σύννεφο λέξεων - μια γραφική αναπαράσταση όλων των λέξεων στη λίστα που δείχνουν το μέγεθος κάθε λέξης ως αναλογική σε μια μέτρηση που καθορίζετε. Για παράδειγμα, αν έχετε ένα λογιστικό φύλλο λέξεων και περιστατικών και θέλετε να προσδιορίσετε τις πιο σημαντικές λέξεις, δοκιμάστε ένα σύννεφο λέξεων.
Τα σύννεφα του Word λειτουργούν επειδή τα περισσότερα δεδομένα των οργανισμών είναι κείμενο. ένα συνηθισμένο παράδειγμα είναι η χρήση από το Twitter των τρεχουσών όρων. Κάθε όρος σε αυτή την αναπαράσταση έχει ένα βάρος που επηρεάζει το μέγεθός του ως δείκτη της σχετικής σημασίας του.
Ένας τρόπος για να ορίσετε αυτό το βάρος θα μπορούσε να είναι από τον αριθμό των φορών που εμφανίζεται μια λέξη στη συλλογή δεδομένων σας. Όσο πιο συχνά εμφανίζεται μια λέξη, το "βαρύτερο" βάρος της - και όσο μεγαλύτερο εμφανίζεται στο σύννεφο.
Πώς να χρησιμοποιήσετε την αναπαράσταση των πτηνών για την πρόβλεψη
Η φυσική συμπεριφορά συρρίκνωσης γενικά είναι ένα αυτο-οργανωτικό σύστημα στο οποίο τα αντικείμενα (κυρίως τα ζωντανά) τείνουν να συμπεριφέρονται σύμφωνα με το περιβάλλον στο οποίο ανήκουν και (β) τις απαντήσεις τους σε άλλα υπάρχοντα αντικείμενα. Η συρρίκνωση των φυσικών κοινωνιών, όπως είναι οι μέλισσες, οι μύγες, τα πουλιά, τα ψάρια και τα μυρμήγκια - ή, για αυτό το λόγο, οι άνθρωποι - είναι επίσης γνωστή ως intelligence .
Τα πουλιά ακολουθούν φυσικούς κανόνες όταν συμπεριφέρονται ως κοπάδι. Τα κοπάδια είναι πτηνά που βρίσκονται σε κάποια απόσταση το ένα από το άλλο. τα πτηνά αυτά θεωρούνται παρόμοια. Κάθε πουλί κινείται σύμφωνα με τους τρεις βασικούς κανόνες που οργανώνουν τη συρρίκνωση της συμπεριφοράς.
-
Διαχωρισμός: Οι συντρόφισσες δεν πρέπει να συγκρούονται μεταξύ τους.
-
Προσανατολισμός: Συντρόφισσες να κινούνται στην ίδια μέση κατεύθυνση με τους γείτονές τους.
-
Συνοχή: Οι συνοδιστές κινούνται σύμφωνα με τη μέση θέση ή θέση των συντρόφων τους.
Η μοντελοποίηση αυτών των τριών κανόνων μπορεί να επιτρέψει σε ένα αναλυτικό σύστημα να προσομοιώσει συμπεριφορές συσσώρευσης. Χρησιμοποιώντας την αυτο-οργανωμένη φυσική συμπεριφορά των πτηνών συρρέουν, μπορείτε να μετατρέψετε ένα απλό υπολογιστικό φύλλο σε μια απεικόνιση.Το κλειδί είναι να ορίσετε την έννοια της ομοιότητας ως μέρος των δεδομένων σας. Ξεκινήστε με μερικές ερωτήσεις:
-
Τι κάνει τα δύο αντικείμενα δεδομένων στα δεδομένα σας παρόμοια;
-
Ποια χαρακτηριστικά μπορούν να οδηγήσουν καλύτερα στην ομοιότητα μεταξύ δύο εγγραφών δεδομένων;
Για παράδειγμα, στα δεδομένα κοινωνικού δικτύου, τα αρχεία δεδομένων αντιπροσωπεύουν μεμονωμένους χρήστες. τα χαρακτηριστικά που τα περιγράφουν μπορούν να περιλαμβάνουν την ηλικία, τον ταχυδρομικό κώδικα, την κατάσταση σχέσης, τη λίστα φίλων, τον αριθμό των φίλων, τις συνήθειες, τις εκδηλώσεις