Πίνακας περιεχομένων:
- Εξόρυξη δεδομένων σε συγκεκριμένες επιχειρηματικές αποστολές
- Εξόρυξη δεδομένων και τεχνητή νοημοσύνη
- Εξόρυξη δεδομένων και στατιστικές
Βίντεο: Big Data (Μεγάλα Δεδομένα): Προκλήσεις και Υποσχέσεις | Minos Garofalakis | TEDxChania 2024
Το χαρακτηριστικό γνώρισμα της εξόρυξης δεδομένων, σε σύγκριση με την ερώτηση, την αναφορά ή ακόμα και το OLAP, είναι ότι μπορείτε να λάβετε πληροφορίες χωρίς να χρειάζεται να κάνετε συγκεκριμένες ερωτήσεις.
Η εξόρυξη δεδομένων εξυπηρετεί δύο κύριους ρόλους στην αποστολή επιχειρησιακής σας ευφυΐας:
-
Ο ρόλος "Πες τι μπορεί να συμβεί": Ο πρώτος ρόλος της εξόρυξης δεδομένων είναι προγνωστική, στην οποία λέτε βασικά: θα μπορούσε να συμβεί. "Χρησιμοποιώντας τις κρυφές γνώσεις που κλειδώνουν στην αποθήκη δεδομένων σας, οι πιθανότητες και η πιθανότητα μελλοντικών τάσεων και περιστατικών εκτοξεύονται και παρουσιάζονται σε εσάς.
-
Ο ρόλος "Πείτε μου κάτι ενδιαφέρον": Εκτός από πιθανά μελλοντικά γεγονότα και περιστατικά, η εξόρυξη δεδομένων προσπαθεί επίσης να βγάλει ενδιαφέρουσες πληροφορίες που πιθανώς θα πρέπει να γνωρίζετε, όπως ένα ιδιαίτερα ασυνήθιστη σχέση μεταξύ πωλήσεων δύο διαφορετικών προϊόντων και πώς αυτές οι σχέσεις ποικίλλουν ανάλογα με την τοποθέτηση στα καταστήματα λιανικής πώλησης.
Αν και πολλά από αυτά τα ενδιαφέροντα tidbits είναι πιθανό να υπάρχουν, ποιες ερωτήσεις θα ρωτούσατε εάν χρησιμοποιούσατε ένα εργαλείο αναζήτησης ή OLAP και πώς θα ερμήνατε τα αποτελέσματα; Η εξόρυξη δεδομένων σας βοηθάει σε αυτό το δύσκολο έργο να υπολογίσετε ποιες ερωτήσεις πρέπει να ζητήσετε, κάνοντας μια μεγάλη εργασία για σας.
Εξόρυξη δεδομένων σε συγκεκριμένες επιχειρηματικές αποστολές
Η εξόρυξη δεδομένων είναι ιδιαίτερα κατάλληλη για τους συγκεκριμένους τύπους επιχειρησιακών αποστολών:
-
Εντοπισμός απάτης
-
Καθορισμός αποτελεσματικότητας προγράμματος μάρκετινγκ
-
Επιλογή από ποιον, από μια μεγάλη πελατειακή βάση ή ο γενικός πληθυσμός, πρέπει να στοχεύσετε ως μέρος ενός προγράμματος μάρκετινγκ
-
Διαχείριση κύκλου ζωής του πελάτη, συμπεριλαμβανομένης της αποστολής διατήρησης πελατών
-
Εκτέλεση προχωρημένων μοντέλων επιχειρηματικών διαδικασιών και σεναρίων
Σκεφτείτε τι είναι πίσω από κάθε επιχειρηματική αποστολή στην προηγούμενη λίστα:
-
Ένα μεγάλο ποσό δεδομένων
-
Ένα ακόμη μεγαλύτερο αριθμός συνδυασμών διαφόρων στοιχείων
-
Ανάλυση με έντονη ανάλυση αποτελεσμάτων, που συνήθως περιλαμβάνει σύνθετους αλγορίθμους και προηγμένες στατιστικές τεχνικές
Τώρα, σκεφτείτε τι θα έπρεπε να κάνετε εάν χρησιμοποιούσατε ένα εργαλείο αναφοράς ή OLAP για να ολοκληρώσετε αυτές τις αποστολές. Θα ήταν σχεδόν αδύνατο να εκτελέσετε όλες τις προηγούμενες αποστολές αν έπρεπε να κάνετε μια ερώτηση και να λάβετε ένα αποτέλεσμα, να κάνετε μια άλλη ερώτηση και να λάβετε ένα άλλο αποτέλεσμα και, στη συνέχεια, να συνεχίσετε αυτά τα βήματα.
Εξόρυξη δεδομένων και τεχνητή νοημοσύνη
Εάν βρισκόσασταν εδώ και τουλάχιστον μια δεκαετία στο πεδίο της πληροφορικής (IT), ορισμένοι από τους προηγούμενους όρους μπορεί να ακούγονται αόριστα οικείοι.Ξεκλείδωμα κρυφών γνώσεων; Προγνωστική λειτουργικότητα; Περιμένετε ένα λεπτό - αυτή είναι η τεχνητή νοημοσύνη!
Από τις πρώτες ημέρες των εμπορικών υπολογιστών, υπήρξε ένα τεράστιο ενδιαφέρον για την ανάπτυξη «μηχανών σκέψης» που μπορούν να επεξεργάζονται μεγάλα ποσά δεδομένων και να λαμβάνουν αποφάσεις βάσει αυτής της ανάλυσης.
Το ενδιαφέρον για την τεχνητή νοημοσύνη (AI) χτύπησε το ζενίθ του στα μέσα της δεκαετίας του '80. Εκείνη την εποχή, οι προμηθευτές βάσεων δεδομένων εργάζονταν στην παραγωγή συστημάτων διαχείρισης βάσεων γνώσεων (KBMS). άλλοι πωλητές βγήκαν με κέλυφος εμπειρογνωμόνων , ή πλαίσια ανάπτυξης εφαρμογών που βασίζονται σε ΑΙ που χρησιμοποίησαν τεχνικές όπως η αλυσιδωτή αλυσίδα και η αλυσιδωτή αλυσίδα για την παροχή συμβουλών στους χρήστες σχετικά με τις αποφάσεις. και τα νευρωνικά δίκτυα τοποθετήθηκαν ως η επόμενη μεγάλη ανάπτυξη ΑΙ.
Το ενδιαφέρον για το AI εξαφανίστηκε στις αρχές της δεκαετίας του 1990, όταν οι προσδοκίες υπερέβησαν τις διαθέσιμες δυνατότητες και άλλες φρενίτιδες, όπως η μετανάστευση πελάτη / διακομιστή και (φυσικά) η αποθήκευση δεδομένων, κατέλαβε κεντρική θέση.
Τώρα, ο AI είναι πίσω!
Η τεχνική AI με το υψηλότερο προφίλ που χρησιμοποιείται στην εξόρυξη δεδομένων είναι τα νευρωνικά δίκτυα. Τα νευρικά δίκτυα θεωρήθηκαν αρχικά ως ένα μοντέλο επεξεργασίας που μιμούνται τον τρόπο με τον οποίο ο ανθρώπινος εγκέφαλος επιλύει προβλήματα, χρησιμοποιώντας νευρώνες και εξαιρετικά παράλληλη επεξεργασία για την επίλυση προτύπων.
Εφαρμόζοντας αλγόριθμους νευρωνικών δικτύων στους τομείς της επιχειρησιακής ευφυΐας που χειρίζονται τα δεδομένα εξόρυξης δεδομένων (και πάλι, η πρόβλεψη και οι "μου λένε κάτι ενδιαφέρον" αποστολές) φαίνεται να είναι φυσικός αγώνας.
Παρόλο που το παιχνίδι εξόρυξης δεδομένων / νευρωνικού δικτύου αξίζει τον κόπο να το κάνετε, θα πρέπει να το κάνετε προσεκτικά. Μπορείτε να βρείτε πολλές ενδιαφέρουσες και συναρπαστικές τεχνολογίες που, στα χέρια εκείνων που δεν καταλαβαίνουν τους αλγορίθμους, θα αποτύχουν.
Εντούτοις, με σωστή γνώση και εκπαίδευση, μπορείτε να κάνετε μια πλήρη δέσμευση να μεταφέρετε αυτό το είδος επεξεργασίας στο πλαίσιο επιχειρηματικής σας ευφυΐας ως αντιστοίχιση τεχνικής ανάλυσης για την επιχειρηματική ανάλυση που επικεντρώνεται στο OLAP.
Εξόρυξη δεδομένων και στατιστικές
Η πιο ώριμη περιοχή της εξόρυξης δεδομένων είναι η εφαρμογή προηγμένων στατιστικών τεχνικών έναντι των μεγάλων όγκων δεδομένων στην αποθήκη δεδομένων σας. Τα διαφορετικά εργαλεία χρησιμοποιούν διαφορετικούς τύπους στατιστικών τεχνικών, προσαρμοσμένες στις συγκεκριμένες περιοχές που προσπαθούν να αντιμετωπίσουν.
Χωρίς στατιστικό υπόβαθρο, μπορεί να βρεθεί μεγάλη σύγχυση σχετικά με την εξόρυξη δεδομένων. Πρέπει να κάνετε πολλή δουλειά για να εκπαιδεύσετε τους αλγορίθμους και να δημιουργήσετε τους κανόνες για να εξασφαλίσετε σωστά αποτελέσματα με μεγαλύτερα σύνολα δεδομένων. Ωστόσο, υποθέτοντας ότι είστε εξοικειωμένοι με αυτήν την έννοια ή έχετε έναν συνάδελφο που μπορεί να βοηθήσει, ακολουθούν ορισμένοι από τους ευρύτερα μοχλευμένους αλγόριθμους:
-
Αλγόριθμοι ταξινόμησης: Προβλέψτε μια ή περισσότερες διακριτές μεταβλητές, με βάση την άλλη χαρακτηριστικά στο σύνολο δεδομένων. Χρησιμοποιώντας αλγορίθμους ταξινόμησης, το εργαλείο εξόρυξης δεδομένων μπορεί να εξετάσει μεγάλα ποσά δεδομένων και στη συνέχεια να σας ενημερώσει ότι, για παράδειγμα, "Οι πελάτες που διατηρούνται μέσω τουλάχιστον δύο γενεών αγορών προϊόντων τείνουν να έχουν αυτά τα χαρακτηριστικά: Έχουν εισόδημα τουλάχιστον $ 75, 000 και κατέχουν τα δικά τους σπίτια."
-
Αλγόριθμοι παλινδρόμησης: Προβλέψτε μια ή περισσότερες συνεχείς μεταβλητές, όπως το κέρδος ή η απώλεια, με βάση άλλα χαρακτηριστικά στο σύνολο δεδομένων. Οι αλγόριθμοι παλινδρόμησης οδηγούνται μέσω ιστορικών πληροφοριών που παρουσιάζονται στο εργαλείο εξόρυξης δεδομένων "με την πάροδο του χρόνου", καλλίτερα γνωστές ως πληροφορίες .
-
Αλγόριθμοι τμηματοποίησης: Διαχωρίστε τα δεδομένα σε ομάδες ή συμπλέγματα στοιχείων που έχουν παρόμοιες ιδιότητες.
-
Αλγόριθμοι σύνδεσης: Βρείτε συσχετισμούς μεταξύ διαφορετικών χαρακτηριστικών σε ένα σύνολο δεδομένων. Η πιο κοινή εφαρμογή αυτού του είδους αλγορίθμου δημιουργεί κανόνες σύνδεσης, τους οποίους μπορείτε να χρησιμοποιήσετε σε μια ανάλυση καλαθιού αγοράς. Σημειώστε ότι, για παράδειγμα, αν ένας πελάτης αγοράσει ένα συγκεκριμένο πακέτο λογισμικού, έχει την ευκαιρία να αγοράσει τουλάχιστον δύο συσκευασίες πρόσθετων προϊόντων κατά 65% μέσα σε δύο εβδομάδες.
-
Αλγόριθμοι ανάλυσης ακολουθιών: Συγκεντρώστε συχνές ακολουθίες ή επεισόδια σε δεδομένα, όπως ροή διαδρομής ιστού.
Υπάρχουν πολλές άλλες μέθοδοι. Ξεσκονίστε αυτό το παλιό βιβλίο στατιστικών στοιχείων και αρχίστε να διαβάζετε.