Πίνακας περιεχομένων:
- Εξόρυξη και εμπλουτισμός οντοτήτων
- Αναζήτηση και προειδοποίηση
- Συγκεντρωτικές λειτουργίες
- Χαρτογράφηση και επιχειρησιακή ευφυΐα
Βίντεο: Web Programming - Computer Science for Business Leaders 2016 2024
Η αποθήκευση και η ανάκτηση μεγάλων ποσοτήτων δεδομένων και η γρήγορη εκτέλεση είναι εξαιρετικά χρήσιμα, και μόλις αποκτήσετε τα δεδομένα που διαχειρίζεστε πρόσφατα στο NoSQL, μπορείτε να κάνετε σπουδαία πράγματα.
Εξόρυξη και εμπλουτισμός οντοτήτων
Μπορείτε να χρησιμοποιήσετε ενεργοποιητές βάσεων δεδομένων, ενέργειες συναγερμού και εξωτερικά συστήματα για την ανάλυση δεδομένων προέλευσης. Ίσως είναι κυρίως ελεύθερο κείμενο, αλλά αναφέρει γνωστά θέματα. Αυτές οι ενεργοποιήσεις και οι ενέργειες συναγερμού θα μπορούσαν να επισημάνουν το κείμενο ως πρόσωπο ή οργανισμό, να επισημάνει αποτελεσματικά το ίδιο το περιεχόμενο και το έγγραφο που τοποθετεί μέσα.
Ένα καλό παράδειγμα είναι το περιεχόμενο σε ένα ειδησεογραφικό άρθρο. Μπορείτε να χρησιμοποιήσετε ένα εργαλείο όπως το Apache Stanbol ή το OpenCalais για να προσδιορίσετε τους βασικούς όρους. Αυτά τα εργαλεία μπορούν να δουν τον "Πρόεδρο Πούτιν" και να αποφασίσουν ότι πρόκειται για πρόσωπο που ονομάζεται Βλαντιμίρ Πούτιν, ο οποίος είναι Ρώσος, και είναι ο σημερινός πρόεδρος της Ρωσικής Ομοσπονδίας.
Άλλα παραδείγματα περιλαμβάνουν ονόματα ασθενειών και φαρμάκων, οργανώσεις, θέματα συζήτησης, αναφερόμενα προϊόντα και εάν ένα σχόλιο ήταν θετικό ή αρνητικό.
Αυτά είναι όλα τα παραδείγματα της εξαγωγής οντότητας (που είναι η διαδικασία της αυτόματης εξαγωγής τύπων αντικειμένων από τα κείμενα τους) . Προσδιορίζοντας τους βασικούς όρους, μπορείτε να τις επισημάνετε ή να τις τυλίξετε σε ένα στοιχείο XML, το οποίο σας βοηθά να αναζητήσετε περιεχόμενο πιο αποτελεσματικά.
Ο εμπλουτισμός της οντότητας σημαίνει την προσθήκη πληροφοριών που βασίζονται στο αρχικό κείμενο εκτός από την αναγνώρισή του. Στο παράδειγμα του Πούτιν, μπορείτε να μετατρέψετε τη λέξη απλού κειμένου "Πούτιν" στον Πρόεδρο Πούτιν. Εναλλακτικά, μπορείτε να μετατρέψετε το "Λονδίνο" στο Λονδίνο.
Μπορείτε να εμφανίσετε αυτά τα δεδομένα σε μια διεπαφή χρήστη ως επισημασμένο κείμενο με έναν σύνδεσμο προς περισσότερες πληροφορίες για κάθε θέμα.
Μπορείτε να προσφέρετε εμπλουτισμό χρησιμοποιώντας αναζήτηση ελεύθερου κειμένου, προειδοποίηση, ενεργοποιητές βάσεων δεδομένων και ενσωματώσεις σε εξωτερικό λογισμικό όπως το TEMIS Luxid και το SmartLogic.
Αναζήτηση και προειδοποίηση
Αφού αποθηκεύσετε τις πληροφορίες σας, ίσως θέλετε να την αναζητήσετε. Η αναζήτηση με ελεύθερο κείμενο είναι απλή, αλλά μετά την εκτέλεση της εξαγωγής οντότητας, έχετε περισσότερες επιλογές. Μπορείτε να αναζητήσετε συγκεκριμένα ένα άτομο με το όνομα "Orange" (όπως στο William of Orange) και όχι να αναζητήσετε αρχεία που να αναφέρουν τον όρο πορτοκαλί - που φυσικά είναι επίσης ένα χρώμα και ένα φρούτο.
Κάτι τέτοιο έχει ως αποτέλεσμα μια πιο λεπτομερή αναζήτηση. Επιτρέπει επίσης την πλούσια πλοήγηση. Αν πάτε στο Αμαζόνιο και ψάξετε για τον Χάρι Πότερ, θα δείτε κατηγορίες για βιβλία, ταινίες, παιχνίδια και ούτω καθεξής. Η κατηγορία προϊόντων είναι ένα παράδειγμα facet , το οποίο σας δείχνει μια πτυχή των δεδομένων μέσα στα αποτελέσματα αναζήτησης - δηλαδή τις πιο κοινές τιμές κάθε πτυχής σε όλα τα αποτελέσματα αναζήτησης, αυτά που δεν βρίσκονται στην τρέχουσα σελίδα.
Οι διεπαφές χρήστη μπορούν να υποστηρίξουν πλούσιες έρευνες σε δεδομένα (καθώς και βασικές αναζητήσεις της Google). Οι χρήστες μπορούν επίσης να τις χρησιμοποιήσουν για να αποθηκεύσουν και να φορτώσουν προηγούμενες αναζητήσεις.
Μπορείτε να ρυθμίσετε αποθηκευμένα κριτήρια αναζήτησης έτσι ώστε οι ειδοποιήσεις να ενεργοποιούνται όταν οι νέες προσθήκες αντιστοιχούν σε αυτά τα κριτήρια. Έτσι, αν φτάσει μια νέα εγγραφή που ταιριάζει με τα κριτήρια αναζήτησης, εμφανίζεται μια ενέργεια. Ίσως ο "Πούτιν" να γίνει Πούτιν
Δεν είναι όλες οι μηχανές αναζήτησης ικανές να καταστήσουν κάθε ερώτημα ερώτημα μια προειδοποίηση. Ορισμένα περιορίζονται σε πεδία κειμένου. άλλοι δεν μπορούν να κάνουν γεωπεριβαλλοντικά κριτήρια. Βεβαιωθείτε ότι η δική σας μπορεί να χειριστεί τις ειδοποιήσεις που πρέπει να διαμορφώσετε.
Συγκεντρωτικές λειτουργίες
Μόλις βρείτε τις σχετικές πληροφορίες, μπορεί να θέλετε να σκάψετε βαθύτερα. Ανάλογα με την πηγή, μπορείτε να ρωτήσετε πόσες χώρες έχουν ΑΕγχΠ άνω των 400 δισεκατομμυρίων δολαρίων ή ποια είναι η μέση ηλικία όλων των μελών του οικογενειακού δέντρου σας ή πού συμβαίνουν τα περισσότερα τσιμπήματα φιδιών στην Αυστραλία. Αυτά τα παραδείγματα απεικονίζουν τον τρόπο με τον οποίο εκτελούνται αναλύσεις σε ένα σύνολο αποτελεσμάτων αναζήτησης. Αυτές είναι οι μετρήσεις, ο μέσος μέσος όρος και οι γεωπολιτικοί υπολογισμοί της θερμικής ανάλυσης, αντίστοιχα.
Η δυνατότητα πραγματοποίησης τέτοιων υπολογισμών δίπλα στα δεδομένα προσφέρει πολλά πλεονεκτήματα. Το πρώτο πλεονέκτημα είναι ότι μπορείτε να χρησιμοποιήσετε τους δείκτες για να επιταχύνετε τα πράγματα. Δεύτερον, οι δείκτες αυτοί πιθανόν να αποθηκευτούν στη μνήμη, καθιστώντας τους ακόμη πιο γρήγορους. Τρίτον, οι δείκτες μνήμης είναι ιδιαίτερα χρήσιμοι για μια βάση δεδομένων NoSQL που χρησιμοποιεί αποθήκευση αρχείων συστήματος Hadoop (HDFS). Το HDFS δεν καταγράφει εγγενή ευρετηρίαση ή αποθηκεύει στήλες μνήμης για τους ίδιους τους υπολογισμούς ταχείας συνάθροισης - απαιτεί μια βάση δεδομένων NoSQL στην κορυφή για να το κάνει αυτό.
Η πλοήγηση με την όψη είναι ένα παράδειγμα συσσωρεύσεων βασισμένων σε μετρήσεις πάνω από τα αποτελέσματα αναζήτησης που εμφανίζονται σε μια διεπαφή χρήστη. Το ίδιο ισχύει για ένα χρονοδιάγραμμα που δείχνει τον αριθμό των εγγραφών που αναφέρουν ένα συγκεκριμένο χρονικό σημείο. Για παράδειγμα, θέλετε να εμφανίσετε αποτελέσματα από αυτό το έτος, αυτόν τον μήνα ή αυτή την ώρα;
Αν θέλετε αυτή τη λειτουργία, βεβαιωθείτε ότι η βάση δεδομένων σας έχει τη δυνατότητα να υπολογίζει αποτελεσματικά τα αθροίσματα δίπλα στα δεδομένα. Οι περισσότερες βάσεις δεδομένων του NoSQL, αλλά μερικοί δεν το κάνουν.
Χαρτογράφηση και επιχειρησιακή ευφυΐα
Η επόμενη προφανής επέκταση διεπαφής χρήστη περιλαμβάνει τη χαρτογράφηση και την προβολή περιλήψεων πίνακα για ζωντανές πληροφορίες διαχείρισης και ιστορική ανάλυση επιχειρησιακών πληροφοριών.
Οι περισσότερες βάσεις δεδομένων του NoSQL παρέχουν ένα εύκολο στην ενσωμάτωση REST API στις βάσεις δεδομένων τους. Αυτό σημαίνει ότι μπορείτε να συνδέσετε μια σειρά από επίπεδα εφαρμογών ή ακόμα και να συνδέσετε απευθείας εφαρμογές JavaScript σε αυτές τις βάσεις δεδομένων. Μια ποικιλία από εξαιρετικές βιβλιοθήκες χαρτογράφησης είναι διαθέσιμες για JavaScript. Μπορείτε ακόμη να χρησιμοποιήσετε το R Ecosystem για να δημιουργήσετε διαγράμματα με βάση τα δεδομένα που διατηρούνται σε αυτές τις βάσεις δεδομένων, αφού εγκαταστήσετε έναν κατάλληλο σύνδεσμο βάσης δεδομένων.
Ορισμένες βάσεις δεδομένων του NoSQL προσφέρουν ακόμη και μια προσθήκη σχεσιακής βάσης δεδομένων ODBC ή JDBC. Η δημιουργία ευρετηρίων μέσα σε μια συγκεκριμένη εγγραφή και η εμφάνισή τους ως μια σχεσιακή προβολή είναι ένας τακτικός τρόπος να μετατραπούν μη δομημένα δεδομένα σε μια βάση δεδομένων εγγράφων NoSQL σε δεδομένα που μπορούν να αναλυθούν με ένα εργαλείο επιχειρηματικής ευφυΐας.
Ελέγξτε εάν ο προμηθευτής βάσης δεδομένων NoSQL παρέχει εργαλεία οπτικοποίησης ή έχει επιχειρηματικούς εταίρους με εργαλεία από ό, τι μπορεί να συνδεθεί με αυτές τις βάσεις δεδομένων. Στα εργαλεία της Vogue περιλαμβάνεται ο Tableau Server, ένας σύγχρονος κοινόχρηστος διακομιστής επιχειρηματικών πληροφοριών που υποστηρίζει τη δημοσίευση διαλογικών αναφορών σε δεδομένα σε διάφορες βάσεις δεδομένων, συμπεριλαμβανομένων των βάσεων δεδομένων NoSQL.