Πίνακας περιεχομένων:
- Η ένταση για μεγάλα δεδομένα
- Clarabridge για μεγάλα δεδομένα
- Η IBM για τα μεγάλα δεδομένα
- Το OpenText για τα μεγάλα δεδομένα
- Το SAS για τα μεγάλα δεδομένα
Βίντεο: Differential equations, studying the unsolvable | DE1 2024
Εδώ είναι μια επισκόπηση ορισμένων από τους παίκτες στην ανάλυση κειμένου μεγάλη αγορά δεδομένων. Ορισμένα είναι μικρά ενώ άλλα είναι οικιακά ονόματα. Μερικοί καλούν τι κάνουν μεγάλα αναλυτικά στοιχεία δεδομένων , ενώ μερικοί απλά αναφέρονται σε αυτό ως αναλυτικά στοιχεία κειμένου .
Η ένταση για μεγάλα δεδομένα
Η Attensity είναι μία από τις αρχικές εταιρίες αναλυτικών κειμένων που άρχισαν να αναπτύσσουν και να πωλούν προϊόντα πριν από περισσότερα από δέκα χρόνια. Αυτή τη στιγμή, έχει πάνω από 150 εταιρικούς πελάτες και μία από τις μεγαλύτερες ομάδες ανάπτυξης NLP στον κόσμο. Η ένταση προσφέρει αρκετούς μηχανισμούς για την ανάλυση των κειμένων. Αυτά περιλαμβάνουν την αυτόματη ταξινόμηση, την εξαγωγή οντοτήτων και την εξαντλητική εξαγωγή. Εξαντλητική Εξαγωγή είναι η ναυαρχίδα τεχνολογίας Attentivity που εξάγει αυτόματα τα δεδομένα από αναλυμένο κείμενο και οργανώνει αυτές τις πληροφορίες.
Η εταιρεία επικεντρώνεται στην κοινωνική και πολυκαναλική ανάλυση και αφοσίωση αναλύοντας κείμενο για την αναφορά από εσωτερικές και εξωτερικές πηγές και έπειτα τη δρομολόγηση σε επιχειρησιακούς χρήστες για εμπλοκή. Πρόσφατα αγόρασε το Biz360, μια εταιρεία κοινωνικών μέσων που συγκεντρώνει τεράστια ροές κοινωνικών μέσων. Έχει αναπτύξει ένα σύστημα υπολογιστών πλέγματος που παρέχει δυνατότητες υψηλής απόδοσης για την επεξεργασία τεράστιων ποσοτήτων κειμένου σε πραγματικό χρόνο.
Η Attensity χρησιμοποιεί ένα πλαίσιο Hadoop για την αποθήκευση δεδομένων. Έχει επίσης ένα σύστημα αναμονής δεδομένων που δημιουργεί μια διαδικασία ορχηστρώσεως που αναγνωρίζει τις αιχμές στα εισερχόμενα δεδομένα και ρυθμίζει την επεξεργασία σε περισσότερους / λιγότερους εξυπηρετητές ανάλογα με τις ανάγκες.
Clarabridge για μεγάλα δεδομένα
Ένας άλλος πωλητής αναλυτικών στοιχείων, Clarabridge είναι στην πραγματικότητα ένα spin-off μιας εταιρίας παροχής συμβουλών επιχειρησιακής ευφυΐας (Claraview) που συνειδητοποίησε την ανάγκη αντιμετώπισης μη δομημένων δεδομένων. Στόχος του είναι να βοηθήσει τις επιχειρήσεις να επιτύχουν μετρήσιμη επιχειρηματική αξία, εξετάζοντας τον πελάτη ολιστικά, προσδιορίζοντας βασικές εμπειρίες και ζητήματα και βοηθώντας όλους σε έναν οργανισμό να αναλάβουν δράση και να συνεργαστούν σε πραγματικό χρόνο.
Περιλαμβάνει τον προσδιορισμό σε πραγματικό χρόνο του συναισθήματος και της ταξινόμησης των δεδομένων / κειμένου ανατροφοδότησης των πελατών και τη σταδιακή κατάθεση των λέξεων για μελλοντική επεξεργασία στο σύστημα Clarabridge.
Αυτή τη στιγμή, η Clarabridge προσφέρει στους πελάτες της μερικά εξελιγμένα και ενδιαφέροντα χαρακτηριστικά, συμπεριλαμβανομένης της ανάλυσης βασικών αιτιών ενός κλικ, για να προσδιορίσει τι προκαλεί αλλαγή στον όγκο των ροών κειμένου, του συναισθήματος ή της ικανοποίησης που σχετίζονται με τα αναδυόμενα ζητήματα. Προσφέρει επίσης τη λύση ως λογισμικό ως υπηρεσία (SaaS).
Η IBM για τα μεγάλα δεδομένα
Ο γίγαντας του λογισμικού Η IBM προσφέρει πολλές λύσεις στο χώρο της ανάλυσης κειμένου υπό την ομπρέλα στρατηγικής Smarter Planet.Εκτός από τις υπηρεσίες Watson και IBM SPSS, η IBM προσφέρει επίσης το IBM Content Analytics με Enterprise Search. Το IBM Content Analytics αναπτύχθηκε με βάση εργασίες που έγιναν στο IBM Research.
Το IBM Content Analytics χρησιμοποιείται για τη μετατροπή του περιεχομένου σε πληροφορίες που έχουν αναλυθεί και αυτό είναι διαθέσιμο για αναλυτικές αναλύσεις παρόμοιες με τον τρόπο με τον οποίο τα δομημένα δεδομένα θα αναλυθούν σε ένα σύνολο εργαλείων BI. Το IBM Content Analytics και Enterprise Search ήταν κάποτε δύο ξεχωριστά προϊόντα.
Η συγκλινόμενη λύση στοχεύει τόσο σε ενισχυμένη επιχειρηματική αναζήτηση που χρησιμοποιεί αναλυτικά στοιχεία κειμένου, όσο και σε αυτόνομες ανάγκες ανάλυσης περιεχομένου. Το ICAES έχει στενή συνεργασία με την πλατφόρμα IBM InfoSphere BigInsights, επιτρέποντας πολύ μεγάλες συλλογές αναλυτικής αναζήτησης και περιεχομένου.
Το OpenText για τα μεγάλα δεδομένα
Η OpenText, μια εταιρεία με έδρα το Καναδά, είναι πιθανότατα πιο γνωστή για την ηγετική της θέση στις λύσεις διαχείρισης επιχειρηματικών πληροφοριών. Το όραμά της περιστρέφεται γύρω από τη διαχείριση, την εξασφάλιση και την εξαγωγή αξίας από τα αδόμητα δεδομένα των επιχειρήσεων. Παρέχει αυτό που λέει "σημασιολογικό μεσαίο λογισμικό. "
Σύμφωνα με την εταιρεία, η εξέλιξη της σημασιολογικής τεχνολογίας της βασίζεται στην ικανότητά της" να επιτρέπει την ανάλυση σε πραγματικό χρόνο με μεγάλη ακρίβεια στα μεγάλα σύνολα δεδομένων σε διάφορες γλώσσες, μορφές και τομείς της βιομηχανίας. "Η ιδέα του σημασιολογικού middleware είναι ότι η σημασιολογία μπορεί να εκτεθεί σε διαφορετικά επίπεδα και να συνεργαστεί με διαφορετικές τεχνολογίες για να αντιμετωπίσει επιχειρηματικά ζητήματα.
Με άλλα λόγια, τα αναλύματα κειμένου μπορούν να ενεργοποιηθούν και να χρησιμοποιηθούν όπου χρειάζεται.
Το SAS για τα μεγάλα δεδομένα
Η SAS επιλύει σύνθετα μεγάλα προβλήματα δεδομένων για μεγάλο χρονικό διάστημα. Πριν από μερικά χρόνια, αγόρασε τον πωλητή αναλυτικών στοιχείων Teragram για να ενισχύσει τη στρατηγική του να χρησιμοποιεί τόσο δομημένα όσο και μη δομημένα δεδομένα στην ανάλυση και να ενσωματώνει αυτά τα δεδομένα για περιγραφικό και προγνωστικό μοντέλο. Τώρα, οι δυνατότητες ανάλυσης κειμένου αποτελούν μέρος της συνολικής πλατφόρμας ανάλυσης και τα δεδομένα κειμένου θεωρούνται απλώς μια άλλη πηγή δεδομένων.
Η SAS συνεχίζει να καινοτομεί στον τομέα των αναλύσεων υψηλής απόδοσης για να διασφαλίσει ότι οι επιδόσεις ανταποκρίνονται στις προσδοκίες των πελατών. Ο στόχος είναι να ληφθούν τα προβλήματα που έλαβαν εβδομάδες για την επίλυσή τους και την επίλυσή τους μέσα σε λίγες μέρες, ή προβλήματα που έλαβαν ημέρες για να τα λύσουν και να τα λύσουν μέσα σε λίγα λεπτά.
Για παράδειγμα, ο διακομιστής SAS High Performance Analytics είναι μια λύση μνήμης που σας επιτρέπει να αναπτύξετε αναλυτικά μοντέλα χρησιμοποιώντας πλήρη δεδομένα, όχι μόνο ένα υποσύνολο συγκεντρωτικών δεδομένων. Η SAS λέει ότι μπορείτε να χρησιμοποιήσετε χιλιάδες μεταβλητές και εκατομμύρια έγγραφα ως μέρος αυτής της ανάλυσης. Η λύση βασίζεται σε συσκευές EMC Greenplum ή Teradata καθώς και σε υλικό βασικών προϊόντων που χρησιμοποιεί Hadoop Distributed File System (HDFS).