Πίνακας περιεχομένων:
- Εστίαση στην επιχείρηση εξόρυξης δεδομένων
- Θα ήταν υπέροχο αν οι ανθρακωρύχοι θα μπορούσαν να περάσουν όλη την ημέρα κάνοντας ανακαλύψεις που αλλάζουν τη ζωή τους, δημιουργώντας πολύτιμα μοντέλα και ενσωματώνοντάς τα σε καθημερινές επιχειρήσεις. Αλλά αυτό είναι σαν να λέγαμε ότι θα ήταν υπέροχο αν οι αθλητές θα μπορούσαν να περάσουν όλα τα τουρνουά νίκης. Χρειάζεται πολλή προετοιμασία για να φτιάξουμε αυτές τις στιγμές θριάμβου. Έτσι, όπως οι αθλητές, οι ανθρακωρύχοι δεδομένων ξοδεύουν πολύ χρόνο για την προετοιμασία.
- Μια καλή διαδικασία εργασίας σας βοηθά να αξιοποιήσετε στο έπακρο το χρόνο σας, τα δεδομένα σας και όλους τους άλλους πόρους σας. Σε αυτό το βιβλίο, θα ανακαλύψετε τη δημοφιλέστερη διαδικασία εξόρυξης δεδομένων, CRISP-DM. Είναι ένας κύκλος έξι φάσεων ανακάλυψης και δράσης που δημιουργήθηκε από μια κοινοπραξία ανθρακωρύχων δεδομένων από πολλές βιομηχανίες και ένα ανοικτό πρότυπο που μπορεί να χρησιμοποιήσει κανείς.
- Μια αναφορά μπορεί να σας πει ότι οι πωλήσεις έχουν μειωθεί. Μπορεί να σπάσει τις πωλήσεις κατά περιοχή, προϊόν και κανάλι, ώστε να γνωρίζετε πού μειώθηκαν οι πωλήσεις και εάν αυτές οι μειώσεις ήταν ευρέως διαδεδομένες ή επηρέαζαν μόνο ορισμένες περιοχές. Αλλά δεν σας παρέχουν ενδείξεις σχετικά με τις πωλήσεις
- Όροι όπως πρότυπο πρότυπο, στατιστικό μοντέλο,
- Χρησιμοποιήστε το μοντέλο για προβλέψεις παρτίδων. (Για παράδειγμα, θα μπορούσατε να βαθμολογήσετε τον κατάλογο πελατών εντός της επιχείρησης για να αποφασίσετε ποιοι πελάτες θα πρέπει να λάβουν μια συγκεκριμένη προσφορά.)
Βίντεο: Παίζουμε Minecraft: Survival | #2 - Ό,τι Να' ναι 2024
Αν σκέφτεστε τα δεδομένα ως πρώτη ύλη και τις πληροφορίες που μπορείτε να πάρετε από τα δεδομένα ως κάτι πολύτιμο και σχετικά εκλεπτυσμένο, η διαδικασία εξαγωγής πληροφοριών μπορεί να είναι σε σύγκριση με την εξαγωγή μετάλλων από μεταλλεύματα ή πετράδια από τη βρωμιά. Έτσι δημιουργήθηκε ο όρος εξόρυξη δεδομένων .
Εστίαση στην επιχείρηση εξόρυξης δεδομένων
Οι ανθρακωρύχοι δεδομένων δεν σκέπτονται μόνο τα δεδομένα χωρίς σκοπό, ελπίζοντας να βρουν κάτι ενδιαφέρον. Κάθε έργο εξόρυξης δεδομένων αρχίζει με ένα συγκεκριμένο επιχειρησιακό πρόβλημα και έναν στόχο που ταιριάζει.
Ως ανθρακωρύχος, πιθανότατα δεν θα έχετε την εξουσία να λαμβάνετε τελικές επιχειρηματικές αποφάσεις, γι 'αυτό είναι σημαντικό να ευθυγραμμίσετε την εργασία σας με τις ανάγκες των υπευθύνων λήψης αποφάσεων. Πρέπει να κατανοήσετε τα προβλήματα, τις ανάγκες και τις προτιμήσεις τους και να εστιάσετε τις προσπάθειές σας στην παροχή πληροφοριών που υποστηρίζουν τις καλές επιχειρηματικές αποφάσεις.
Οι δικές σας επιχειρηματικές γνώσεις είναι πολύ σημαντικές. Τα στελέχη δεν πρόκειται να κάθονται δίπλα σας ενώ εργάζεστε, παρέχοντας ανατροφοδότηση σχετικά με τη συνάφεια των ανακαλύψεών σας με τις ανησυχίες τους. Πρέπει να χρησιμοποιήσετε τη δική σας εμπειρία και να αισθάνεστε δυνατά να το κρίνετε αυτό για τον εαυτό σας καθώς εργάζεστε.
Θα ήταν υπέροχο αν οι ανθρακωρύχοι θα μπορούσαν να περάσουν όλη την ημέρα κάνοντας ανακαλύψεις που αλλάζουν τη ζωή τους, δημιουργώντας πολύτιμα μοντέλα και ενσωματώνοντάς τα σε καθημερινές επιχειρήσεις. Αλλά αυτό είναι σαν να λέγαμε ότι θα ήταν υπέροχο αν οι αθλητές θα μπορούσαν να περάσουν όλα τα τουρνουά νίκης. Χρειάζεται πολλή προετοιμασία για να φτιάξουμε αυτές τις στιγμές θριάμβου. Έτσι, όπως οι αθλητές, οι ανθρακωρύχοι δεδομένων ξοδεύουν πολύ χρόνο για την προετοιμασία.
Μια καλή διαδικασία εργασίας σας βοηθά να αξιοποιήσετε στο έπακρο το χρόνο σας, τα δεδομένα σας και όλους τους άλλους πόρους σας. Σε αυτό το βιβλίο, θα ανακαλύψετε τη δημοφιλέστερη διαδικασία εξόρυξης δεδομένων, CRISP-DM. Είναι ένας κύκλος έξι φάσεων ανακάλυψης και δράσης που δημιουργήθηκε από μια κοινοπραξία ανθρακωρύχων δεδομένων από πολλές βιομηχανίες και ένα ανοικτό πρότυπο που μπορεί να χρησιμοποιήσει κανείς.
Οι φάσεις της διαδικασίας CRISP-DM είναι
Κατανόηση της επιχείρησης
-
Δεδομένα Κατανόηση
-
Προετοιμασία δεδομένων
-
Μοντελοποίηση
-
Αξιολόγηση
-
φάση έχει το ίδιο βάρος ως προς την ποιότητα των αποτελεσμάτων και της αξίας για την επιχείρηση. Αλλά όσον αφορά τον απαιτούμενο χρόνο, η προετοιμασία των δεδομένων κυριαρχεί. Η προετοιμασία των δεδομένων διαρκώς απαιτεί περισσότερο χρόνο από όλες τις άλλες φάσεις της διαδικασίας εξόρυξης δεδομένων σε συνδυασμό.
-
Δημιουργία μοντέλων
Όταν οι στόχοι κατανοούνται και τα δεδομένα καθαρίζονται και είναι έτοιμα να χρησιμοποιηθούν, μπορείτε να στρέψετε την προσοχή σας στην κατασκευή προγνωστικών μοντέλων.Τα μοντέλα κάνουν τις αναφορές που δεν μπορούν. σας δίνουν πληροφορίες που υποστηρίζουν τη δράση.
Μια αναφορά μπορεί να σας πει ότι οι πωλήσεις έχουν μειωθεί. Μπορεί να σπάσει τις πωλήσεις κατά περιοχή, προϊόν και κανάλι, ώστε να γνωρίζετε πού μειώθηκαν οι πωλήσεις και εάν αυτές οι μειώσεις ήταν ευρέως διαδεδομένες ή επηρέαζαν μόνο ορισμένες περιοχές. Αλλά δεν σας παρέχουν ενδείξεις σχετικά με τις πωλήσεις
που μειώθηκαν ή ποιες ενέργειες θα μπορούσαν να βοηθήσουν στην αναζωογόνηση της επιχείρησης.
Τα μοντέλα σας βοηθούν να κατανοήσετε τους παράγοντες που επηρεάζουν τις πωλήσεις, τις ενέργειες που τείνουν να αυξάνουν ή να μειώνουν τις πωλήσεις και τις στρατηγικές και τακτικές που διατηρούν την επιχείρησή σας ομαλή. Αυτό είναι συναρπαστικό, έτσι δεν είναι; Ίσως γι 'αυτό οι περισσότεροι ανθρακωρύχοι δεδομένων θεωρούν ότι η μοντελοποίηση είναι το διασκεδαστικό μέρος της εργασίας. Κατανόηση μαθηματικών μοντέλων Τα μαθηματικά μοντέλα είναι κεντρικά για την εξόρυξη δεδομένων, αλλά τι είναι αυτά; Τι κάνουν, πώς λειτουργούν και πώς δημιουργούνται;
Ένα μαθηματικό μοντέλο είναι απλό και απλό, μια εξίσωση ή σύνολο εξισώσεων που περιγράφουν μια σχέση ανάμεσα σε δύο ή περισσότερα πράγματα. Τέτοιες εξισώσεις είναι στενογραφικές για τις θεωρίες για τη λειτουργία της φύσης και της κοινωνίας. Η θεωρία μπορεί να υποστηριχθεί από ένα σημαντικό αριθμό στοιχείων ή μπορεί να είναι απλώς μια άγρια εικασία. Η γλώσσα των μαθηματικών είναι η ίδια σε κάθε περίπτωση.
Όροι όπως πρότυπο πρότυπο, στατιστικό μοντέλο,
ή
γραμμικό μοντέλο
αναφέρονται σε συγκεκριμένους τύπους μαθηματικών μοντέλων, τα ονόματα που αντικατοπτρίζουν την προβλεπόμενη χρήση, τη μορφή ή τη μέθοδο απόκτησης ένα συγκεκριμένο μοντέλο. Αυτά τα τρία παραδείγματα είναι μόνο μερικοί από πολλούς αυτούς τους όρους. Όταν ένα μοντέλο αναφέρεται σε μια επιχειρηματική ρύθμιση, είναι πιθανότατα ένα μοντέλο που χρησιμοποιείται για την πραγματοποίηση προβλέψεων. Τα μοντέλα χρησιμοποιούνται για την πρόβλεψη των τιμών των μετοχών, των πωλήσεων προϊόντων και των ποσοστών ανεργίας, μεταξύ άλλων. Αυτές οι προβλέψεις ενδέχεται να είναι ακριβείς, αλλά για οποιοδήποτε δεδομένο σύνολο τιμών (γνωστοί παράγοντες όπως αυτές ονομάζονται ανεξάρτητες μεταβλητές ή
εισροές) που περιλαμβάνονται στο μοντέλο, βρείτε μια καλά καθορισμένη πρόβλεψη (επίσης αποκαλούμενη εξαρτώμενη μεταβλητή, έξοδος, ή αποτέλεσμα ). Τα μαθηματικά μοντέλα χρησιμοποιούνται και για άλλους σκοπούς στις επιχειρήσεις, όπως για να περιγράψουν τους μηχανισμούς εργασίας που οδηγούν σε μια συγκεκριμένη διαδικασία. Κατά την εξόρυξη δεδομένων, δημιουργείτε μοντέλα βρίσκοντας πρότυπα στα δεδομένα χρησιμοποιώντας μηχανική μάθηση ή στατιστικές μεθόδους. Οι ανθρακωρύχοι δεδομένων δεν ακολουθούν την ίδια αυστηρή προσέγγιση που κάνουν οι κλασσικοί στατιστικολόγοι, αλλά όλα τα μοντέλα προέρχονται από τα πραγματικά δεδομένα και τις συνεπείς τεχνικές μαθηματικής μοντελοποίησης. Όλα τα μοντέλα εξόρυξης δεδομένων υποστηρίζονται από ένα σύνολο αποδεικτικών στοιχείων. Γιατί να χρησιμοποιήσετε μαθηματικά μοντέλα; Δεν θα μπορούσαν να περιγραφούν οι ίδιες σχέσεις χρησιμοποιώντας λέξεις; Αυτό είναι δυνατό, αλλά βρίσκετε ορισμένα πλεονεκτήματα στη χρήση των εξισώσεων. Αυτά περιλαμβάνουν την Ευκολία: Σε σύγκριση με ισοδύναμες περιγραφές γραμμένες σε προτάσεις, οι εξισώσεις είναι σύντομες. Ο μαθηματικός συμβολισμός έχει εξελιχθεί ειδικά για το σκοπό της εκπροσώπησης των μαθηματικών σχέσεων. γλώσσες όπως τα αγγλικά δεν έχουν.
Σαφήνεια:
Οι εξισώσεις μεταφέρουν τις ιδέες συνοπτικά και είναι σαφείς.Δεν υπόκεινται σε διαφορετικές ερμηνείες βασισμένες στον πολιτισμό και ο συμβολισμός των μαθηματικών είναι ένα είδος κοινής γλώσσας που χρησιμοποιείται ευρέως σε ολόκληρο τον κόσμο.
-
Συνέπεια: Επειδή οι μαθηματικές αναπαραστάσεις είναι ξεκάθαρες, οι συνέπειες οποιασδήποτε συγκεκριμένης κατάστασης καθορίζονται σαφώς από ένα μαθηματικό μοντέλο.
-
Ενεργοποίηση πληροφοριών Ένα μοντέλο αποδίδει αξία μόνο όταν το χρησιμοποιείτε στην επιχείρηση. Οι προβλέψεις ενός μοντέλου ενδέχεται να υποστηρίξουν τη λήψη αποφάσεων με διάφορους τρόπους. Μπορείτε να
-
Ενσωμάτωση προβλέψεων σε μια αναφορά ή μια παρουσίαση που θα χρησιμοποιηθεί για τη λήψη συγκεκριμένης απόφασης. Ενσωματώστε το μοντέλο σε λειτουργικό σύστημα (όπως σύστημα εξυπηρέτησης πελατών) για να παρέχει προβλέψεις σε πραγματικό χρόνο για καθημερινή χρήση. (Για παράδειγμα, μπορείτε να επισημάνετε τις ασφαλιστικές απαιτήσεις για άμεση πληρωμή, άμεση άρνηση ή περαιτέρω έρευνα.)