Βίντεο: 2019 SNF Conference Day 2 Part 2 (mixed) 2024
Η εξόρυξη δεδομένων γίνεται με δοκιμές και σφάλματα, οπότε, για τους ανθρακωρύχους δεδομένων, τα λάθη είναι φυσικά. Τα λάθη μπορεί να είναι πολύτιμα, με άλλα λόγια, τουλάχιστον υπό ορισμένες προϋποθέσεις. Ωστόσο, δεν δημιουργούνται όλα τα λάθη ίσα. Μερικοί απλά αποφεύγονται. Η παρακάτω λίστα προσφέρει δέκα τέτοια λάθη. Εάν τα διαβάσετε προσεκτικά και τα δεσμεύσετε στη μνήμη, απλά θα μπορούσατε να αποφύγετε λίγες προσκρούσεις στην καμπύλη μάθησης:
-
Παράλειψη ελέγχων ποιότητας δεδομένων: Οι περισσότεροι ανθρακωρύχοι πιστεύουν ότι η ανάπτυξη προγνωστικών μοντέλων είναι πιο διασκεδαστική από την ανασκόπηση δεδομένων για προβλήματα ποιότητας. Αν όμως αποτύχετε να εντοπίσετε και να διορθώσετε προβλήματα ποιότητας δεδομένων, θα μπορούσατε να καταλήξετε σε άχρηστες προβλέψεις.
-
Λείπει το σημείο: Έχετε ανακαλύψει κάτι συναρπαστικό! Αυτό είναι ωραίο, αλλά αν δεν είναι επίσης σχετικό με το επιχειρηματικό πρόβλημα που θέλατε να λύσετε, δεν είναι καθόλου σχετικό. Επιστρέψτε στην πορεία.
-
Πιστεύοντας ότι ένα μοτίβο στα δεδομένα αποδεικνύει μια σχέση αιτίου-αποτελέσματος: Εξετάζετε ένα σύνολο δεδομένων και παρατηρείτε ότι όταν αυξάνεται η Μεταβλητή Α, αυξάνεται και η Μεταβλητή Β. Αυτό μπορεί να συμβεί επειδή η Μεταβλητή Α επηρεάζει τη Μεταβλητή Β ή επειδή η Μεταβλητή Β επηρεάζει την Μεταβλητή Α. Από την άλλη πλευρά, μπορεί να επηρεαστεί και από τις δύο άλλες μεταβλητές που δεν έχετε εξετάσει. Ή θα μπορούσε να είναι μια μοναδική σύμπτωση. Ποιος μπορεί να πει?
-
Διαλύοντας τα συμπεράσματα πολύ μακριά: Μην υποθέτετε ότι οι σχέσεις που παρατηρείτε στα δεδομένα θα επαναληφθούν υπό διαφορετικές συνθήκες. Εάν τα δεδομένα σας συλλέχθηκαν σε ένα δροσερό περιβάλλον, μην υποθέσετε ότι τα πράγματα θα λειτουργήσουν με τον ίδιο τρόπο σε μια καυτή εργοστασιακή ρύθμιση.
-
Στοίχημα για αποτελέσματα που δεν έχουν νόημα: Οι μέθοδοι εξόρυξης δεδομένων είναι ανεπίσημες και συνήθως δεν υποστηρίζονται από επιστημονική μέθοδο και θεωρία, έτσι ώστε τα αποτελέσματά σας να έχουν καλύτερη τουλάχιστον επιχειρηματική αίσθηση. Εάν δεν υπάρχει κανένας λόγος για την ορθή ερμηνεία των αποτελεσμάτων που παρουσιάζετε, η εκτελεστική σας διεύθυνση πιθανότατα δεν θα το πάρει σοβαρά, και δεν θα έπρεπε.
-
Η αγάπη με μια συγκεκριμένη μέθοδο μοντελοποίησης: Δεν υπάρχει κανένας τύπος μοντέλου εξόρυξης δεδομένων που να ταιριάζει σε κάθε κατάσταση.
-
Βάζοντας ένα μοντέλο στην παραγωγή χωρίς επαρκείς ελέγχους: Μη στοιχηματίζετε την επιχείρησή σας σε ένα μοντέλο πρόβλεψης, μέχρι να το δοκιμάσετε με δεδομένα αναμονής και σε μικρή κλίμακα στο πεδίο.
-
Αγνοώντας τα αποτελέσματα που δεν σας αρέσει: Εάν αγνοήσετε τα δεδομένα σας τώρα, θα επιστρέψει μια μέρα και θα πει: «Σας το είπα. "
-
Χρησιμοποιώντας την εξόρυξη δεδομένων για την αντιμετώπιση κάθε ανάγκης ανάλυσης δεδομένων: Η εξόρυξη δεδομένων έχει τεράστια αξία, ωστόσο ορισμένες εφαρμογές εξακολουθούν να απαιτούν αυστηρές μεθόδους συλλογής δεδομένων, επίσημη στατιστική ανάλυση και επιστημονική μέθοδο.
-
Υποθέτοντας ότι οι παραδοσιακές τεχνικές ανάλυσης δεδομένων δεν έχουν σημασία: Ανατρέξτε στην προηγούμενη κουκκίδα.