Σπίτι Προσωπικά Οικονομικά Hadoop MapReduce για μεγάλα δεδομένα - dummies

Hadoop MapReduce για μεγάλα δεδομένα - dummies

Πίνακας περιεχομένων:

Βίντεο: How to Install Hadoop on Windows 2024

Βίντεο: How to Install Hadoop on Windows 2024
Anonim

Για να κατανοήσουμε πλήρως τις δυνατότητες του Hadoop MapReduce, είναι σημαντικό να διαφοροποιήσουμε το MapReduce (τον αλγόριθμο) εφαρμογή του MapReduce. Το Hadoop MapReduce είναι μια εφαρμογή του αλγορίθμου που αναπτύχθηκε και συντηρείται από το έργο Apache Hadoop.

Είναι χρήσιμο να σκεφτούμε την εφαρμογή ως μηχανή MapReduce, γιατί ακριβώς αυτό λειτουργεί. Παρέχετε εισροή (καύσιμο), ο κινητήρας μετατρέπει την είσοδο σε έξοδο γρήγορα και αποτελεσματικά και παίρνετε τις απαντήσεις που χρειάζεστε.

Το Hadoop MapReduce περιλαμβάνει διάφορα στάδια, το καθένα με ένα σημαντικό σύνολο από πράξεις που βοηθούν να φτάσετε στο στόχο σας να λάβετε τις απαντήσεις που χρειάζεστε από τα μεγάλα δεδομένα. Η διαδικασία ξεκινά με ένα αίτημα χρήστη να εκτελέσει ένα πρόγραμμα MapReduce και συνεχίζει έως ότου τα αποτελέσματα επιστραφούν στο HDFS.

Τα αρχεία HDFS και MapReduce εκτελούν την εργασία τους σε κόμβους σε ένα σύμπλεγμα που φιλοξενείται σε ράφια διακομιστών βασικών προϊόντων. Για να απλοποιηθεί η συζήτηση, το διάγραμμα δείχνει μόνο δύο κόμβους.

Αποκτήστε τα μεγάλα δεδομένα έτοιμα

Όταν ένας πελάτης ζητήσει να εκτελεστεί ένα πρόγραμμα MapReduce, το πρώτο βήμα είναι να εντοπίσετε και να διαβάσετε το αρχείο εισόδου που περιέχει τα ακατέργαστα δεδομένα. Η μορφή αρχείου είναι εντελώς αυθαίρετη, αλλά τα δεδομένα πρέπει να μετατραπούν σε κάτι που μπορεί να επεξεργαστεί το πρόγραμμα. Αυτή είναι η λειτουργία του InputFormat και του RecordReader. Το InputFormat αποφασίζει τον τρόπο με τον οποίο το αρχείο πρόκειται να σπάσει σε μικρότερα κομμάτια για επεξεργασία χρησιμοποιώντας μια λειτουργία που ονομάζεται InputSplit.

Στη συνέχεια, εκχωρεί ένα RecordReader για να μετατρέψει τα ακατέργαστα δεδομένα προς επεξεργασία από το χάρτη. Διάφοροι τύποι RecordReaders παρέχονται με Hadoop, προσφέροντας μια μεγάλη ποικιλία επιλογών μετατροπής. Αυτό το χαρακτηριστικό είναι ένας από τους τρόπους με τους οποίους ο Hadoop διαχειρίζεται την τεράστια ποικιλία τύπων δεδομένων που βρίσκονται σε μεγάλα προβλήματα δεδομένων.

Αφήστε το μεγάλο χάρτη δεδομένων να αρχίσει

Τα δεδομένα σας είναι τώρα σε μορφή αποδεκτή από τον χάρτη. Για κάθε ζεύγος εισόδου, μια ξεχωριστή εμφάνιση του χάρτη καλείται να επεξεργαστεί τα δεδομένα. Αλλά τι κάνει με την επεξεργασμένη παραγωγή και πώς μπορείτε να τα παρακολουθείτε;

Ο χάρτης διαθέτει δύο πρόσθετες δυνατότητες για την αντιμετώπιση των ερωτήσεων. Επειδή χάρτης και μείωση της ανάγκης να συνεργαστούν για να επεξεργαστούν τα δεδομένα σας, το πρόγραμμα πρέπει να συλλέξει την παραγωγή από τους ανεξάρτητους χαρτογράφους και να το μεταβιβάσει στους μειωτήρες. Αυτή η εργασία εκτελείται από ένα OutputCollector. Μια λειτουργία Reporter παρέχει επίσης πληροφορίες που συλλέγονται από τις εργασίες χαρτών ώστε να γνωρίζετε πότε ή εάν οι εργασίες χαρτών είναι πλήρεις.

Όλα αυτά τα έργα εκτελούνται ταυτόχρονα σε πολλαπλούς κόμβους του cluster Hadoop.Μπορεί να έχετε περιπτώσεις όπου η έξοδος από ορισμένες διαδικασίες χαρτογράφησης πρέπει να συσσωρευτεί πριν αρχίσουν οι μειωτήρες. Ή, ορισμένα από τα ενδιάμεσα αποτελέσματα ίσως χρειαστούν επεξεργασία πριν από τη μείωση.

Επιπλέον, μερικές από αυτές τις εξόδους μπορεί να βρίσκονται σε κόμβο διαφορετικό από τον κόμβο όπου θα εκτελούνται οι μειωτήρες για τη συγκεκριμένη έξοδο. Η συλλογή και η αναδιάταξη των ενδιάμεσων αποτελεσμάτων πραγματοποιούνται από ένα διαχωριστικό και ένα είδος. Οι εργασίες χαρτών θα δώσουν τα αποτελέσματα σε ένα συγκεκριμένο διαμέρισμα ως εισροές στις εργασίες μείωσης.

Αφού ολοκληρωθούν όλες οι εργασίες χαρτών, τα ενδιάμεσα αποτελέσματα συγκεντρώνονται στο διαμέρισμα και εμφανίζεται ανακατεύθυνση, διαχωρίζοντας την έξοδο για βέλτιστη επεξεργασία μειώνοντας.

Μείωση και συνδυασμός για μεγάλα δεδομένα

Για κάθε ζεύγος εξόδου, η μείωση καλείται να εκτελέσει την εργασία της. Με παρόμοιο τρόπο με το χάρτη, η μείωση μειώνει την παραγωγή της ενώ όλες οι εργασίες επεξεργάζονται. Η μείωση δεν μπορεί να ξεκινήσει μέχρι να ολοκληρωθεί η χαρτογράφηση. Η παραγωγή της μείωσης είναι επίσης ένα κλειδί και μια αξία. Παρόλο που αυτό είναι απαραίτητο για να μειωθεί η εργασία του, μπορεί να μην είναι η πιο αποτελεσματική μορφή εξόδου για την εφαρμογή σας.

Hadoop παρέχει μια λειτουργία OutputFormat και λειτουργεί πολύ σαν το InputFormat. Το OutputFormat παίρνει το ζεύγος κλειδιού-τιμής και οργανώνει την έξοδο για εγγραφή σε HDFS. Το τελευταίο καθήκον είναι να γράψετε πραγματικά τα δεδομένα σε HDFS. Αυτό γίνεται από το RecordWriter και εκτελεί όμοια με το RecordReader εκτός από το αντίθετο. Παίρνει τα δεδομένα OutputFormat και τα γράφει σε HDFS στη μορφή που είναι απαραίτητη για τις απαιτήσεις του προγράμματος.

Ο συντονισμός όλων αυτών των δραστηριοτήτων έγινε σε παλαιότερες εκδόσεις του Hadoop από έναν προγραμματιστή εργασίας. Αυτός ο χρονοπρογραμματιστής ήταν στοιχειώδης και, καθώς ο συνδυασμός των θέσεων εργασίας άλλαξε και αυξήθηκε, ήταν σαφές ότι ήταν αναγκαία μια διαφορετική προσέγγιση. Η πρωτογενής ανεπάρκεια στον παλιό χρονοπρογραμματιστή ήταν η έλλειψη διαχείρισης των πόρων. Η τελευταία έκδοση του Hadoop έχει αυτή τη νέα δυνατότητα.

Hadoop MapReduce είναι η καρδιά του συστήματος Hadoop. Παρέχει όλες τις δυνατότητες που χρειάζεστε για να σπάσετε τα μεγάλα δεδομένα σε διαχειρίσιμα κομμάτια, να επεξεργαστείτε τα δεδομένα παράλληλα στο κατανεμημένο σύμπλεγμα και, στη συνέχεια, να κάνετε τα δεδομένα διαθέσιμα για κατανάλωση από τον χρήστη ή για πρόσθετη επεξεργασία. Και όλα αυτά δουλεύουν με εξαιρετικά ανθεκτικό, ανθεκτικό σε λάθη τρόπο. Αυτό είναι μόνο η αρχή.

Hadoop MapReduce για μεγάλα δεδομένα - dummies

Η επιλογή των συντακτών

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Οι πιο βασικές ηλεκτρονικές χρήσεις ενός ενισχυτή Op είναι ως ενισχυτής. Εάν συνδέσετε μια πηγή εισόδου σε έναν από τους ακροδέκτες εισόδου και γειώσετε τον άλλο ακροδέκτη εισόδου, εμφανίζεται μια ενισχυμένη έκδοση του σήματος εισόδου στο εξωτερικό τερματικό. Μια σημαντική ιδέα στα κυκλώματα op-amp ...

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Για την οικοδόμηση ενός πραγματικού ηλεκτρονικού κυκλώματος χρησιμοποιώντας Op-amp, φυσικά, θα πρέπει να χρησιμοποιήσετε ένα πραγματικό ενισχυτή op. Ευτυχώς, τα ενσωματωμένα ολοκληρωμένα κυκλώματα (IC) είναι άφθονα και σχεδόν όλα τα καταστήματα που πωλούν ηλεκτρονικά εξαρτήματα πωλούν διάφορους τύπους φθηνών IC-ενισχυτών. Το πιο δημοφιλές op-amp IC είναι το LM741, το οποίο έρχεται ...

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

. Η ακριβής κυματομορφή που παράγεται εξαρτάται από τον τύπο του κυκλώματος που χρησιμοποιείται για τη δημιουργία του ταλαντωτή. Ένα από τα συνηθέστερα χρησιμοποιούμενα κυκλώματα ταλαντωτών είναι κατασκευασμένο από ένα ζεύγος τρανζίστορ που είναι εφοδιασμένα για να εναλλάσσονται και να σβήνουν εναλλάξ. Αυτός ο τύπος κυκλώματος είναι ...

Η επιλογή των συντακτών

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Η ασήμαντη εκπαίδευση είναι ένα σημαντικό βήμα στην ανάπτυξη των παιδιών. Ως γονέας, θα πρέπει να αναγνωρίσετε τα σημάδια ότι το παιδί σας είναι έτοιμο για την ομιλία της τουαλέτας, να ξεκινήσει μια διαδικασία ασήμαντης κατάρτισης, να συνεχίσει τη διαδικασία και να αναγνωρίσει πότε το παιδί σας είναι σχεδόν εκεί. Κατά τη διάρκεια της διαδρομής, πρέπει να σιγουρευτείτε ότι το παιδί σας ξέρει ...

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Παιδιά, ανάλογα με την αναπηρία. Μπορεί να χρειαστεί να παρέχετε στηρίγματα υψηλής τεχνολογίας που διευκολύνουν την κίνηση από τον περιπατητή ή την αναπηρική καρέκλα στην τουαλέτα (δείτε την ενότητα "Εργασία με ειδικό εργαλείο" σε αυτό το άρθρο.) Από την άλλη πλευρά, το παιδί σας μπορεί να ...

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Την ημέρα που κάθε γονιός επιθυμεί, αλλά δεν μπορείτε να βιάσετε τη διαδικασία. Περιμένετε τα σημάδια ότι το παιδί σας είναι έτοιμο να αντιμετωπίσει αυτή τη μεγάλη πρόκληση. Παρακολουθήστε τα σημεία στην παρακάτω λίστα. οι πρώτες πέντε είναι απολύτως απαραίτητες: μένει ξηρό τουλάχιστον δύο ώρες παίρνει Bummed από υγρό ή ...

Η επιλογή των συντακτών

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Αναδυόμενο πεδίο της ιατρικής μυαλού-σώματος υπενθυμίζει στους ανθρώπους - και γιόγκι και σοφοί έχουν πει για χιλιετίες - το σώμα σας, το μυαλό σας και η καρδιά σας αποτελούν ένα ενιαίο και αδιάσπαστο σύνολο. Όταν οι σκέψεις σας συνεχίζουν να σφύζουν από την ανησυχία σας, το σώμα σας αποκρίνεται με τη σύσφιξη και την τάνυση, ειδικά σε ορισμένες σημαντικές θέσεις ...

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πόνος είναι κάτι που θα αντιμετωπίσει κάποιος σε κάποιο σημείο . Η προσοχή μπορεί να σας βοηθήσει να προσεγγίσετε πόνο με υγιεινό τρόπο. Ο οξύς πόνος είναι ένας αιχμηρός πόνος που διαρκεί για μικρό χρονικό διάστημα, μερικές φορές ορίζεται ως λιγότερο από 12 εβδομάδες. Η ιατρική είναι αρκετά καλή για τη θεραπεία του οξέος πόνου. Ο χρόνιος πόνος είναι ο πόνος που διαρκεί ...

Βελτίωση των σχέσεών σας - ανδρείκεS

Βελτίωση των σχέσεών σας - ανδρείκεS

Σχέσεις - είτε με την οικογένεια, τους φίλους ή τους εραστές; Και δεν έχει σημασία πόσο χαρούμενος και ευχαριστημένος είστε με τις σημαντικές σχέσεις στη ζωή σας, υπάρχει πάντα περιθώριο βελτίωσης. Οι σχέσεις, όπως όλες οι διεργασίες, επίσης καταλήγουν και ρέουν και σας παρουσιάζουν προκλήσεις. Εδώ είναι μερικές εξαιρετικές τεχνικές για να σας βοηθήσουμε ...