Πίνακας περιεχομένων:
- 1ος νόμος: Επιχειρηματικοί στόχοι
- 2ος νόμος: Επιχειρηματικές γνώσεις
- 3ος νόμος: Προετοιμασία δεδομένων
- 4 ο νόμος: Το σωστό μοντέλο
- 5ος νόμος: Pattern
- 6ος νόμος: Ενίσχυση
- 7ος νόμος: Πρόβλεψη
- Ο 8ος νόμος: Αξία
- 9ος Νόμος: Αλλαγή
Βίντεο: О ДЕВЯТОМ КРУГЕ 2024
Κάθε επάγγελμα έχει τις κατευθυντήριες αρχές του, ιδέες που παρέχουν δομή και καθοδήγηση στην καθημερινή εργασία. Η εξόρυξη δεδομένων δεν αποτελεί εξαίρεση. Ακολουθούν εννέα θεμελιώδεις ιδέες για να σας καθοδηγήσουν, καθώς κατεβαίνετε στη δουλειά σας και να γίνετε ορυχείο δεδομένων. Αυτοί είναι οι 9 Νόμοι της Εξόρυξης Δεδομένων όπως είχαν δηλώσει αρχικά ο πρωτοπόρος μεταφορέας δεδομένων Thomas Khabaza.
1ος νόμος: Επιχειρηματικοί στόχοι
Εδώ είναι ο 1ος νόμος για την Εξόρυξη Δεδομένων ή "Νόμος Επιχειρηματικών Στόχων": Οι επιχειρηματικοί στόχοι αποτελούν την προέλευση κάθε λύσης εξόρυξης δεδομένων.
Εξερευνείτε τα δεδομένα για να βρείτε πληροφορίες που σας βοηθούν να διευθύνετε καλύτερα την επιχείρηση. Δεν πρέπει αυτό να είναι το μάντρα της ανάλυσης όλων των επιχειρηματικών δεδομένων; Φυσικά θα έπρεπε! Ωστόσο, οι αρχάριοι ανθρακωρύχοι συχνά επικεντρώνονται στην τεχνολογία και άλλες λεπτομέρειες, οι οποίες μπορεί να είναι ενδιαφέρουσες αλλά όχι ευθυγραμμισμένες με τις ανάγκες και τους στόχους των εκτελεστικών φορέων λήψης αποφάσεων.
Πρέπει να αναπτύξετε μια συνήθεια για τον προσδιορισμό επιχειρηματικών στόχων προτού κάνετε οτιδήποτε άλλο και να εστιάσετε σε αυτούς τους στόχους σε κάθε βήμα της διαδικασίας εξόρυξης δεδομένων. Είναι σημαντικό ότι ο νόμος αυτός είναι ο πρώτος. Ο καθένας πρέπει να καταλάβει ότι η εξόρυξη δεδομένων είναι μια διαδικασία με σκοπό.
2ος νόμος: Επιχειρηματικές γνώσεις
Εδώ είναι ο 2ος νόμος περί εξόρυξης δεδομένων ή «νόμος περί επιχειρηματικών γνώσεων»: Οι επιχειρηματικές γνώσεις είναι καίριες για κάθε βήμα της διαδικασίας εξόρυξης δεδομένων.
Η εξόρυξη δεδομένων δίνει τη δύναμη στους ανθρώπους - επιχειρηματίες - που χρησιμοποιούν τις επιχειρηματικές γνώσεις, την εμπειρία και τη γνώση τους, μαζί με τις μεθόδους εξόρυξης δεδομένων, για να βρουν νόημα στα δεδομένα.
Δεν χρειάζεται να είσαι fancy statistician για να κάνεις εξόρυξη δεδομένων, αλλά πρέπει να γνωρίζεις κάτι για το τι σημαίνουν τα δεδομένα και πώς λειτουργεί η επιχείρηση. Μόνο όταν κατανοείτε τα δεδομένα και το πρόβλημα που χρειάζεστε για να λύσετε, οι διαδικασίες εξόρυξης δεδομένων σας βοηθούν να ανακαλύψετε χρήσιμες πληροφορίες και να τις χρησιμοποιήσετε.
3ος νόμος: Προετοιμασία δεδομένων
Εδώ είναι ο 3ος νόμος περί εξόρυξης δεδομένων ή "νόμος περί επεξεργασίας δεδομένων": Η προετοιμασία δεδομένων είναι περισσότερο από το ήμισυ κάθε διεργασίας εξόρυξης δεδομένων.
Οι παραδοσιακοί στατιστικολόγοι έχουν συχνά την ευκαιρία να συλλέξουν νέα δεδομένα για την αντιμετώπιση συγκεκριμένων ερευνητικών ζητημάτων. Μπορούν να χρησιμοποιούν αυστηρές διαδικασίες για να προγραμματίσουν πειράματα, να σχεδιάσουν ερευνητικά ερωτηματολόγια έρευνας ή να συλλέξουν με άλλο τρόπο δεδομένα υψηλής ποιότητας που στοχεύουν σε συγκεκριμένους ερευνητικούς στόχους. Ωστόσο, μετά από όλα αυτά, ξοδεύουν πολύ χρόνο καθαρισμό και προετοιμασία δεδομένων για ανάλυση.
Οι ανθρακωρύχοι δεδομένων, από την άλλη πλευρά, σχεδόν πάντα πρέπει να δουλεύουν με τα δεδομένα που είναι διαθέσιμα. Χρησιμοποιούν τα υπάρχοντα επιχειρηματικά αρχεία, τα δημόσια δεδομένα ή τα δεδομένα που μπορούν να αγοράσουν.Είναι πιθανό ότι όλα αυτά τα δεδομένα συγκεντρώθηκαν για κάποιο άλλο σκοπό εκτός από την εξόρυξη δεδομένων και χωρίς κανένα αυστηρό σχέδιο ή προσεκτική διαδικασία συλλογής δεδομένων. Έτσι, οι ανθρακωρύχοι δεδομένων ξοδεύουν πολύ χρόνο για την προετοιμασία των δεδομένων.
4 ο νόμος: Το σωστό μοντέλο
Ο 4ος νόμος περί εξόρυξης δεδομένων ή "NFL-DM": Το σωστό μοντέλο για μια δεδομένη εφαρμογή μπορεί να ανακαλυφθεί μόνο με πείραμα.
Αυτός ο νόμος είναι επίσης γνωστός με τη στενογραφία NFL-DM, που σημαίνει ότι δεν υπάρχει δωρεάν γεύμα για τον ανθρακωρύχο δεδομένων.
Πρώτον, ποιο είναι το μοντέλο; Είναι μια εξίσωση που αντιπροσωπεύει ένα πρότυπο που παρατηρείται στα δεδομένα. Τουλάχιστον, αντιπροσωπεύει το σχέδιο με έναν τραχύ τρόπο. Τα μαθηματικά μοντέλα των πραγματικών πραγμάτων δεν είναι ποτέ τέλεια! Αυτό είναι ένα γεγονός της ζωής, και είναι εξίσου αληθινό για τους πυρηνικούς φυσικούς όπως και για τους ανθρακωρύχους δεδομένων.
Κατά την εξόρυξη δεδομένων, τα μοντέλα επιλέγονται μέσω δοκιμών και σφαλμάτων. Θα πειραματιστείτε με διαφορετικούς τύπους μοντέλων.
5ος νόμος: Pattern
Εδώ είναι ο πέμπτος νόμος της Εξόρυξης Δεδομένων: Υπάρχουν πάντα μοτίβα.
Ως ανθρακωρύχος δεδομένων, θα εξερευνήσετε δεδομένα σε αναζήτηση χρήσιμων μοτίβων. Με άλλα λόγια, θα αναζητάτε σημαντικές σχέσεις μεταξύ των μεταβλητών στα δεδομένα. Η κατανόηση αυτών των σχέσεων παρέχει καλύτερη κατανόηση της επιχείρησης και καλύτερες προβλέψεις για το τι θα συμβεί στο μέλλον. Το πιο σημαντικό, η κατανόηση προτύπων στα δεδομένα σας δίνει τη δυνατότητα να επηρεάσετε τι θα συμβεί στο μέλλον.
Βρίσκετε πάντα μοτίβα. Τα δεδομένα έχουν πάντα κάτι να σας πουν. Μερικές φορές, επιβεβαιώνει ότι αυτό που έχετε κάνει είναι σωστό. Αυτό μπορεί να μην φαίνεται συναρπαστικό, αλλά τουλάχιστον σας λέει ότι είστε στο σωστό δρόμο. Άλλες ημέρες, τα δεδομένα ενδέχεται να σας ενημερώσουν ότι οι τρέχουσες επιχειρηματικές πρακτικές σας δεν λειτουργούν. Αυτό είναι συναρπαστικό και παρόλο που ίσως δεν είναι ευχάριστο βραχυπρόθεσμα, η γνώση της αλήθειας είναι ένα σημαντικό βήμα προς τη βελτίωση.
6ος νόμος: Ενίσχυση
Εδώ είναι ο 6ος νόμος για την εξόρυξη δεδομένων ή "Insight Law": Η εξόρυξη δεδομένων ενισχύει την αντίληψη στον τομέα των επιχειρήσεων.
Οι μέθοδοι εξόρυξης δεδομένων σάς επιτρέπουν να κατανοείτε καλύτερα την επιχείρησή σας από ό, τι θα μπορούσατε να κάνετε χωρίς αυτούς. Οι μέθοδοι εξόρυξης δεδομένων σάς βοηθούν όπως ένα μεγεθυντικό φακό ή ένα μικροσκόπιο, επιτρέποντας την ανακάλυψη αποτελεσμάτων που θα ήταν δύσκολο ή αδύνατο να ανιχνευθεί μέσω τακτικών αναφορών.
Η εξόρυξη δεδομένων δεν είναι άμεση.
Η ανακάλυψη και η εκμάθηση μέσω της εξόρυξης δεδομένων είναι μια διαδραστική διαδικασία. Θα κάνετε ανακαλύψεις, θα μάθετε λίγο από κάθε ένα από αυτά και θα χρησιμοποιήσετε όσα έχετε ανακαλύψει για να αναλάβετε δράση. Τα αποτελέσματα κάθε ενέργειας που προσπαθείτε θα παράγουν περισσότερα δεδομένα και ότι τα δεδομένα σας επιτρέπουν να κατανοήσετε κάτι περισσότερο. Είναι ένας κύκλος ανακάλυψης και ο κύκλος συνεχίζεται όσο συνεχίζετε να εξερευνούμε και να πειραματιστείτε.
7ος νόμος: Πρόβλεψη
Ο 7ος νόμος περί εξόρυξης δεδομένων ή "πρόβλεψη νόμου": Πρόβλεψη αυξάνει τις πληροφορίες τοπικά με γενίκευση.
Η εξόρυξη δεδομένων σας βοηθά να χρησιμοποιήσετε ό, τι γνωρίζετε για να κάνετε καλύτερες προβλέψεις (ή εκτιμήσεις) για πράγματα που δεν γνωρίζετε. Η εξόρυξη δεδομένων χρησιμοποιεί μεθόδους δεδομένων και μοντέλων για να αντικαταστήσει τις άτυπες προσδοκίες σας με εκτιμημένες από δεδομένα, συνεπείς και πιο ακριβείς εκτιμήσεις.
Ο 8ος νόμος: Αξία
Ο 8ος νόμος για την εξόρυξη δεδομένων ή "Value Law": Η αξία των αποτελεσμάτων εξόρυξης δεδομένων δεν καθορίζεται από την ακρίβεια ή τη σταθερότητα των προγνωστικών μοντέλων.
Οι ανθρακωρύχοι δεδομένων δεν ανατρέπουν τη θεωρία. Σαν ανθρακωρύχος δεδομένων, ίσως δεν γνωρίζετε ούτε καν τη θεωρία πίσω από τα στατιστικά μοντέλα που χρησιμοποιείτε. Ίσως αυτό να είναι εξίσου καλά, γιατί στην εξόρυξη δεδομένων, πρόκειται να χρησιμοποιήσετε αυτά τα μοντέλα με τρόπους που δεν είναι απαραίτητα ευθυγραμμισμένοι με τη θεωρία πίσω από αυτές.
Θα αναζητήσετε μοντέλα που παράγουν σωστές προβλέψεις (και θα χρησιμοποιήσετε τη δοκιμή, αντί για τη στατιστική θεωρία, για να το κρίνετε). Αλλά μπορεί να ανησυχείτε περισσότερο για άλλα ζητήματα, όπως το αν το μοντέλο έχει επιχειρηματική αίσθηση, σας φωτίζει για απροσδόκητους παράγοντες πρόβλεψης ή είναι πρακτικό να το χρησιμοποιήσετε στο χώρο εργασίας σας.
9ος Νόμος: Αλλαγή
Ο 9ος Νόμος της Εξόρυξης Δεδομένων ή "Νόμος της Αλλαγής": Όλα τα πρότυπα υπόκεινται σε αλλαγές.
Ο κόσμος αλλάζει πάντα. Το μοντέλο που σας δίνει μεγάλες προβλέψεις σήμερα μπορεί να είναι άχρηστο αύριο. Αυτό είναι ένα γεγονός της ζωής για όλους τους αναλυτές δεδομένων, όχι μόνο τους ανθρακωρύχους δεδομένων.