Σπίτι Προσωπικά Οικονομικά Ανάλυση κοινωνικού συναίσθηματος με Hadoop - ανδρείκελα

Ανάλυση κοινωνικού συναίσθηματος με Hadoop - ανδρείκελα

Βίντεο: UCY32013 2024

Βίντεο: UCY32013 2024
Anonim

Η ανάλυση κοινωνικού συναίσθηματος είναι εύκολα η πιο υπερβολική η χρήση του Hadoop, η οποία δεν πρέπει να αποτελεί έκπληξη, δεδομένου ότι ο κόσμος συνδέεται συνεχώς και ο σημερινός εκφραστικός πληθυσμός. Αυτή η περίπτωση χρήσης αξιοποιεί περιεχόμενο από φόρουμ, ιστολόγια και άλλους πόρους των κοινωνικών μέσων ενημέρωσης για να αναπτύξει μια αίσθηση του τι κάνουν οι άνθρωποι (για παράδειγμα, γεγονότα ζωής) και πώς αντιδρούν στον κόσμο γύρω τους (συναίσθημα).

Επειδή τα δεδομένα που βασίζονται σε κείμενο δεν ταιριάζουν φυσικά σε μια σχεσιακή βάση δεδομένων, το Hadoop είναι ένα πρακτικό μέρος για να εξερευνήσετε και να εκτελέσετε αναλυτικά δεδομένα.

Η γλώσσα είναι δύσκολο να ερμηνευτεί, ακόμη και για τα ανθρώπινα όντα κατά καιρούς - ειδικά αν διαβάζετε κείμενο γραμμένο από ανθρώπους σε μια κοινωνική ομάδα που είναι διαφορετική από τη δική σας. Αυτή η ομάδα ανθρώπων ίσως μιλάει τη γλώσσα σας, αλλά οι εκφράσεις και το στυλ τους είναι εντελώς ξένες, επομένως δεν έχετε ιδέα αν μιλάνε για μια καλή εμπειρία ή για μια κακή.

βόμβα σε σχέση με μια ταινία, μπορεί να σημαίνει ότι η ταινία ήταν κακή (ή καλή, εάν είστε μέρος της νεολαίας κίνημα που ερμηνεύει "Είναι η βόμβα da" ως φιλοφρόνηση)? φυσικά, αν βρίσκεστε στην επιχείρηση ασφάλειας αερομεταφορών, η λέξη βόμβα έχει πολύ διαφορετική σημασία. Το θέμα είναι ότι η γλώσσα χρησιμοποιείται με πολλούς μεταβλητούς τρόπους και συνεχώς εξελίσσεται. Όταν αναλύετε το συναίσθημα στα κοινωνικά μέσα, μπορείτε να επιλέξετε από πολλές προσεγγίσεις. Η βασική μέθοδος αναλύει προγραμματικά το κείμενο, εξάγει συμβολοσειρές και εφαρμόζει κανόνες. Σε απλές καταστάσεις, αυτή η προσέγγιση είναι εύλογη. Αλλά καθώς οι απαιτήσεις εξελίσσονται και οι κανόνες γίνονται πιο περίπλοκοι, η χειροκίνητη κωδικοποίηση των εξερχόμενων κειμένων γρήγορα δεν γίνεται πλέον εφικτή από την άποψη της συντήρησης κώδικα, ειδικά για τη βελτιστοποίηση της απόδοσης.

Οι προσεγγίσεις γραμματικής και κανόνων που βασίζονται στην επεξεργασία κειμένων είναι υπολογιστικά ακριβές, γεγονός που αποτελεί σημαντικό παράγοντα για την εξαγωγή μεγάλης κλίμακας στο Hadoop. Όσο περισσότερο εμπλέκονται οι κανόνες (κάτι που είναι αναπόφευκτο για σύνθετους σκοπούς, όπως η εξαγωγή συναισθημάτων), τόσο περισσότερη επεξεργασία χρειάζεται.

Εναλλακτικά, μια προσέγγιση βασισμένη στα στατιστικά στοιχεία γίνεται όλο και συχνότερη για την ανάλυση του συναισθήματος. Αντί να γράφετε με πολλούς πολλούς περίπλοκους κανόνες, μπορείτε να χρησιμοποιήσετε τα μοντέλα μηχανικής μάθησης με βάση την ταξινόμηση στο Apache Mahout. Το αλίευμα εδώ είναι ότι θα χρειαστεί να εκπαιδεύσετε τα μοντέλα σας με παραδείγματα θετικού και αρνητικού αισθήματος. Τα περισσότερα στοιχεία εκπαίδευσης που παρέχετε (για παράδειγμα, κείμενο από τα tweets και την ταξινόμησή σας), τόσο ακριβέστερα τα αποτελέσματά σας.

Η περίπτωση χρήσης για την ανάλυση του κοινωνικού συναίσθηματος μπορεί να εφαρμοστεί σε ένα ευρύ φάσμα βιομηχανιών. Για παράδειγμα, εξετάστε την ασφάλεια των τροφίμων: Προσπαθείτε να προβλέψετε ή να εντοπίσετε το ξέσπασμα τροφιμογενών ασθενειών το συντομότερο δυνατόν είναι εξαιρετικά σημαντική για τους υπαλλήλους της υγειονομικής περίθαλψης.

Το παρακάτω σχήμα δείχνει μια εφαρμογή Hadoop-anchored που καταναλώνει tweets χρησιμοποιώντας απορροφητήρες που βασίζονται στην πιθανή ασθένεια: FLU ή FOOD TEISING.

Βλέπετε τον παραγόμενο χάρτη θερμότητας που δείχνει τη γεωγραφική θέση των tweets; Ένα χαρακτηριστικό των δεδομένων σε έναν κόσμο μεγάλων δεδομένων είναι ότι το μεγαλύτερο μέρος του είναι

εμπλουτισμένο στο χώρο: Διαθέτει πληροφορίες για την τοποθεσία (και χρονικά χαρακτηριστικά). Σε αυτήν την περίπτωση, το προφίλ Twitter δημιουργήθηκε με αντίστροφη μηχανική ανεύρεση της δημοσιευμένης θέσης. Όπως αποδεικνύεται, πολλοί λογαριασμοί Twitter έχουν γεωγραφικές τοποθεσίες ως μέρος των δημόσιων προφίλ τους (καθώς και αποποιήσεις ευθύνης που δηλώνουν σαφώς ότι οι σκέψεις τους είναι δικές τους σε αντίθεση με την ομιλία για τους εργοδότες τους).

Πόσο καλός μηχανισμός πρόβλεψης μπορεί να είναι τα κοινωνικά μέσα για το ξέσπασμα της γρίπης ή για ένα περιστατικό τροφικής δηλητηρίασης; Εξετάστε τα δείγματα ανώνυμων δειγμάτων που εμφανίζονται. Μπορείτε να δείτε ότι τα μηνύματα των κοινωνικών μέσων μαζεύτηκαν όλους τους άλλους δείκτες για την πρόβλεψη μιας επιδημίας γρίπης σε μια συγκεκριμένη περιφέρεια του U. S. κατά τη διάρκεια του τέλους του καλοκαιριού και στις αρχές του φθινοπώρου.

Αυτό το παράδειγμα παρουσιάζει ένα άλλο πλεονέκτημα που προκύπτει από την ανάλυση των κοινωνικών μέσων: Σας δίνει μια άνευ προηγουμένου ευκαιρία να εξετάσουμε πληροφορίες χαρακτηριστικών στα προφίλ των αφισών. Χάρη, οι άνθρωποι που λένε για τον εαυτό τους στα προφίλ τους στο Twitter είναι συχνά ελλιπείς (για παράδειγμα, ο κωδικός τοποθεσίας δεν συμπληρώνεται) ή δεν έχει νόημα (ο κωδικός τοποθεσίας μπορεί να λέει

νέφος νέος ). Αλλά μπορείτε να μάθετε πολλά για τους ανθρώπους με την πάροδο του χρόνου, με βάση αυτό που λένε. Για παράδειγμα, ένας πελάτης μπορεί να έχει

tweeted (δημοσιεύτηκε στο Twitter) την ανακοίνωση της γέννησης του μωρού της, μια εικόνα Instagram της τελευταίας ζωγραφικής ή μια ανάρτηση στο Facebook δηλώνοντας ότι δεν μπορεί να πιστέψει τη συμπεριφορά του Walter White στο τελευταίο βράδυ Breaking Bad τελικό. Σε αυτό το πανταχού παρόν παράδειγμα, η επιχείρησή σας μπορεί να εξάγει ένα συμβάν ζωής που φιλοξενεί ένα οικογενειακό γράφημα (ένα νέο παιδί είναι μια πολύτιμη ενημέρωση για ένα προφίλ Master Data Management με βάση το άτομο), ένα χόμπι (ζωγραφική) (αγαπάς την εκπομπή

Breaking Bad ). Με την ανάλυση των κοινωνικών δεδομένων με αυτόν τον τρόπο, έχετε την ευκαιρία να επεξεργαστείτε προσωπικές ιδιότητες με πληροφορίες όπως χόμπι, γενέθλια, γεγονότα ζωής, γεωγραφικές τοποθεσίες (π.χ. χώρα, πολιτεία και πόλη), εργοδότη, φύλο, την κατάσταση και πολλά άλλα.

Υποθέστε για ένα λεπτό ότι είστε ο CIO μιας αεροπορικής εταιρείας. Μπορείτε να χρησιμοποιήσετε τις αναρτήσεις ευχαριστημένων ή θυμωμένων συχνών ταξιδιωτών όχι μόνο για να διαπιστώσετε το συναίσθημα αλλά και για να ολοκληρώσετε τα προφίλ πελατών για το πρόγραμμα αφοσίωσής σας χρησιμοποιώντας πληροφορίες κοινωνικών μέσων ενημέρωσης.

Φανταστείτε πόσο καλύτερα θα μπορούσατε να στοχεύσετε πιθανούς πελάτες με τις πληροφορίες που μόλις μοιράστηκαν - για παράδειγμα, ένα μήνυμα ηλεκτρονικού ταχυδρομείου που λέει στον πελάτη ότι η Season 5 του

Breaking Bad είναι πλέον διαθέσιμη στο σύστημα μέσων ενημέρωσης του αεροσκάφους ή ανακοινώνοντας ότι τα παιδιά ηλικίας κάτω των δύο ετών πετούν δωρεάν. Είναι επίσης ένα καλό παράδειγμα του τρόπου με τον οποίο τα συστήματα εγγραφής (π.χ. πωλήσεις ή βάσεις δεδομένων συνδρομών) μπορούν να ανταποκριθούν στα συστήματα εμπλοκής (πχ. Κανάλια υποστήριξης). Αν και η αποπληρωμή των μελών της πίστης και το ιστορικό ταξιδιών είναι σε μια σχεσιακή βάση δεδομένων, το σύστημα εμπλοκής μπορεί να ενημερώνει τα αρχεία (για παράδειγμα, μια στήλη).

Ανάλυση κοινωνικού συναίσθηματος με Hadoop - ανδρείκελα

Η επιλογή των συντακτών

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Οι πιο βασικές ηλεκτρονικές χρήσεις ενός ενισχυτή Op είναι ως ενισχυτής. Εάν συνδέσετε μια πηγή εισόδου σε έναν από τους ακροδέκτες εισόδου και γειώσετε τον άλλο ακροδέκτη εισόδου, εμφανίζεται μια ενισχυμένη έκδοση του σήματος εισόδου στο εξωτερικό τερματικό. Μια σημαντική ιδέα στα κυκλώματα op-amp ...

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Για την οικοδόμηση ενός πραγματικού ηλεκτρονικού κυκλώματος χρησιμοποιώντας Op-amp, φυσικά, θα πρέπει να χρησιμοποιήσετε ένα πραγματικό ενισχυτή op. Ευτυχώς, τα ενσωματωμένα ολοκληρωμένα κυκλώματα (IC) είναι άφθονα και σχεδόν όλα τα καταστήματα που πωλούν ηλεκτρονικά εξαρτήματα πωλούν διάφορους τύπους φθηνών IC-ενισχυτών. Το πιο δημοφιλές op-amp IC είναι το LM741, το οποίο έρχεται ...

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

. Η ακριβής κυματομορφή που παράγεται εξαρτάται από τον τύπο του κυκλώματος που χρησιμοποιείται για τη δημιουργία του ταλαντωτή. Ένα από τα συνηθέστερα χρησιμοποιούμενα κυκλώματα ταλαντωτών είναι κατασκευασμένο από ένα ζεύγος τρανζίστορ που είναι εφοδιασμένα για να εναλλάσσονται και να σβήνουν εναλλάξ. Αυτός ο τύπος κυκλώματος είναι ...

Η επιλογή των συντακτών

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Η ασήμαντη εκπαίδευση είναι ένα σημαντικό βήμα στην ανάπτυξη των παιδιών. Ως γονέας, θα πρέπει να αναγνωρίσετε τα σημάδια ότι το παιδί σας είναι έτοιμο για την ομιλία της τουαλέτας, να ξεκινήσει μια διαδικασία ασήμαντης κατάρτισης, να συνεχίσει τη διαδικασία και να αναγνωρίσει πότε το παιδί σας είναι σχεδόν εκεί. Κατά τη διάρκεια της διαδρομής, πρέπει να σιγουρευτείτε ότι το παιδί σας ξέρει ...

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Παιδιά, ανάλογα με την αναπηρία. Μπορεί να χρειαστεί να παρέχετε στηρίγματα υψηλής τεχνολογίας που διευκολύνουν την κίνηση από τον περιπατητή ή την αναπηρική καρέκλα στην τουαλέτα (δείτε την ενότητα "Εργασία με ειδικό εργαλείο" σε αυτό το άρθρο.) Από την άλλη πλευρά, το παιδί σας μπορεί να ...

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Την ημέρα που κάθε γονιός επιθυμεί, αλλά δεν μπορείτε να βιάσετε τη διαδικασία. Περιμένετε τα σημάδια ότι το παιδί σας είναι έτοιμο να αντιμετωπίσει αυτή τη μεγάλη πρόκληση. Παρακολουθήστε τα σημεία στην παρακάτω λίστα. οι πρώτες πέντε είναι απολύτως απαραίτητες: μένει ξηρό τουλάχιστον δύο ώρες παίρνει Bummed από υγρό ή ...

Η επιλογή των συντακτών

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Αναδυόμενο πεδίο της ιατρικής μυαλού-σώματος υπενθυμίζει στους ανθρώπους - και γιόγκι και σοφοί έχουν πει για χιλιετίες - το σώμα σας, το μυαλό σας και η καρδιά σας αποτελούν ένα ενιαίο και αδιάσπαστο σύνολο. Όταν οι σκέψεις σας συνεχίζουν να σφύζουν από την ανησυχία σας, το σώμα σας αποκρίνεται με τη σύσφιξη και την τάνυση, ειδικά σε ορισμένες σημαντικές θέσεις ...

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πόνος είναι κάτι που θα αντιμετωπίσει κάποιος σε κάποιο σημείο . Η προσοχή μπορεί να σας βοηθήσει να προσεγγίσετε πόνο με υγιεινό τρόπο. Ο οξύς πόνος είναι ένας αιχμηρός πόνος που διαρκεί για μικρό χρονικό διάστημα, μερικές φορές ορίζεται ως λιγότερο από 12 εβδομάδες. Η ιατρική είναι αρκετά καλή για τη θεραπεία του οξέος πόνου. Ο χρόνιος πόνος είναι ο πόνος που διαρκεί ...

Βελτίωση των σχέσεών σας - ανδρείκεS

Βελτίωση των σχέσεών σας - ανδρείκεS

Σχέσεις - είτε με την οικογένεια, τους φίλους ή τους εραστές; Και δεν έχει σημασία πόσο χαρούμενος και ευχαριστημένος είστε με τις σημαντικές σχέσεις στη ζωή σας, υπάρχει πάντα περιθώριο βελτίωσης. Οι σχέσεις, όπως όλες οι διεργασίες, επίσης καταλήγουν και ρέουν και σας παρουσιάζουν προκλήσεις. Εδώ είναι μερικές εξαιρετικές τεχνικές για να σας βοηθήσουμε ...