Σπίτι Προσωπικά Οικονομικά Η σημασία του MapReduce στο Hadoop - dummies

Η σημασία του MapReduce στο Hadoop - dummies

Βίντεο: Sqoop Import and Export data from RDMBS and HDFS 2025

Βίντεο: Sqoop Import and Export data from RDMBS and HDFS 2025
Anonim

Για το μεγαλύτερο μέρος της ιστορίας του Hadoop, το MapReduce είναι το μοναδικό παιχνίδι στην πόλη όταν πρόκειται για την επεξεργασία δεδομένων. Η διαθεσιμότητα του MapReduce υπήρξε ο λόγος για την επιτυχία του Hadoop και παράλληλα ένας σημαντικός παράγοντας για τον περιορισμό της περαιτέρω υιοθέτησης.

Το MapReduce επιτρέπει στους ειδικευμένους προγραμματιστές να γράφουν κατανεμημένες εφαρμογές χωρίς να χρειάζεται να ανησυχούν για την υποκείμενη κατανεμημένη υποδομή υπολογιστών. Αυτή είναι μια πολύ μεγάλη υπόθεση: ο Hadoop και το πλαίσιο MapReduce χειρίζονται όλα τα είδη πολυπλοκότητας που οι προγραμματιστές εφαρμογών δεν χρειάζεται να χειριστούν.

Για παράδειγμα, η δυνατότητα διαφάνειας του cluster με την προσθήκη κόμβων και η αυτόματη αποτυχία των υποσυστημάτων αποθήκευσης δεδομένων και επεξεργασίας δεδομένων συμβαίνουν με μηδενικό αντίκτυπο στις εφαρμογές.

Η άλλη πλευρά του νομίσματος εδώ είναι ότι αν και το MapReduce κρύβει μια τεράστια πολυπλοκότητα, δεν μπορείτε να αντέξετε οικονομικά να ξεχάσετε τι είναι: μια διεπαφή για παράλληλο προγραμματισμό. Πρόκειται για μια προηγμένη ικανότητα - και ένα εμπόδιο στην ευρύτερη υιοθέτηση. Απλά δεν υπάρχουν ακόμη πολλοί προγραμματιστές MapReduce, και δεν έχουν όλοι την ικανότητα να την κυριαρχήσουν.

Στις πρώτες μέρες του Hadoop (Hadoop 1 και πριν), θα μπορούσατε να εκτελέσετε μόνο εφαρμογές MapReduce στα clusters σας. Στο Hadoop 2, η συνιστώσα YARN άλλαξε όλα αυτά με την ανάληψη διαχείρισης πόρων και προγραμματισμού από το πλαίσιο MapReduce και την παροχή μιας γενικής διεπαφής για να διευκολύνει τις εφαρμογές να τρέχουν σε ένα cluster Hadoop.

Με λίγα λόγια, αυτό σημαίνει ότι το MapReduce είναι τώρα ένα από τα πολλά πλαίσια εφαρμογής που μπορείτε να χρησιμοποιήσετε για να αναπτύξετε και να εκτελέσετε εφαρμογές στον Hadoop. Αν και είναι σίγουρα δυνατή η εκτέλεση εφαρμογών χρησιμοποιώντας άλλα πλαίσια στο Hadoop, αυτό δεν σημαίνει ότι μπορούμε να αρχίσουμε να ξεχνάμε το MapReduce.

Το MapReduce είναι σήμερα το μόνο διαθέσιμο πλαίσιο επεξεργασίας δεδομένων για την Hadoop. Αν και άλλα πλαίσια θα είναι τελικά διαθέσιμα, το MapReduce έχει σχεδόν δεκαετία ωριμότητας κάτω από τη ζώνη του (με σχεδόν 4 000 θέματα JIRA ολοκληρωμένα, που περιλαμβάνουν εκατοντάδες προγραμματιστές, αν παρακολουθείτε).

Δεν υπάρχει αμφιβολία: Το MapReduce είναι το πιο ώριμο πλαίσιο του Hadoop για την επεξεργασία δεδομένων. Επιπλέον, ένα σημαντικό ποσό του κώδικα MapReduce είναι τώρα σε χρήση που είναι απίθανο να πάει οπουδήποτε σύντομα. Μακρά σύντομη ιστορία: Το MapReduce είναι ένα σημαντικό κομμάτι της ιστορίας του Hadoop.

Τα προγράμματα Apache Hive και Apache Pig είναι ιδιαίτερα δημοφιλή επειδή είναι ευκολότερα σημεία εισόδου για την επεξεργασία δεδομένων στο Hadoop. Για πολλά προβλήματα, ειδικά τα είδη που μπορείτε να λύσετε με SQL, Hive και Pig είναι εξαιρετικά εργαλεία.Αλλά για μια εργασία ευρύτερης εμβέλειας, όπως στατιστική επεξεργασία ή εξαγωγή κειμένου, και ειδικά για επεξεργασία μη δομημένων δεδομένων, πρέπει να χρησιμοποιήσετε το MapReduce.

Η σημασία του MapReduce στο Hadoop - dummies

Η επιλογή των συντακτών

Πώς η εταιρεία των αισιόδοξων μπορεί να μειώσει τον θυμό σας - Dummies

Πώς η εταιρεία των αισιόδοξων μπορεί να μειώσει τον θυμό σας - Dummies

Υπάρχει άμεσος σύνδεσμος τη στάση σας για τη ζωή και τη διάθεσή σας. Οι αισιόδοξοι τείνουν να είναι πιο θετικοί και λιγότερο επιρρεπείς στην οργή από τους απαισιόδοξους. Οι απαισιόδοξοι περιμένουν πάντα τα πράγματα να μην αποδειχθούν καλά και ως εκ τούτου είναι πιο ικανά να βρεθούν ανήσυχοι, ανησυχούν και έτοιμοι να θυμούνται όταν τους ...

Γλωσσάριο όρων που σχετίζονται με τη διπολική

Γλωσσάριο όρων που σχετίζονται με τη διπολική

Οξεία: Σχετικά σύντομη αλλά σοβαρή, όπως σε επεισόδιο οξείας διάθεσης. Συμπληρωματικό στην κύρια θεραπεία. συναισθηματική διαταραχή: Μια κατηγορία ψυχιατρικών διαταραχών που περιλαμβάνει κατάθλιψη, διπολική διαταραχή και εποχιακή συναισθηματική διαταραχή (SAD). Η επίδραση είναι ένας ιατρικός όρος για τη διάθεση. ακάθεια: Σοβαρή ανησυχία, πιθανή παρενέργεια ορισμένων φαρμάκων, ειδικά μερικών αντιψυχωσικών. αντισπασμωδικό: ...

Πώς να χρησιμοποιήσετε το γέλιο για να μειώσετε την ευαισθησία σας στο θυμό

Πώς να χρησιμοποιήσετε το γέλιο για να μειώσετε την ευαισθησία σας στο θυμό

Γέλιο είναι (κυριολεκτικά) παυσίπονο. Μπορεί να σκοτώσει τόσο τον σωματικό όσο και τον συναισθηματικό πόνο, μειώνοντας την πιθανότητα ότι ορισμένες καταστάσεις θα σας προκαλέσουν θυμό. Μελέτες που συνέκριναν κάποιο είδος ουδέτερης απόσπασης της προσοχής, χαλάρωσης και γέλιου, έδειξαν ότι το γέλιο είναι πιο αποτελεσματικό στην αύξηση του ορίου πόνου ενός ατόμου. Κατώτατη γραμμή: Το γέλιο μειώνει την ευαισθησία στον πόνο. Το ίδιο ισχύει ...

Η επιλογή των συντακτών

Δημιουργώντας μια αναφορά σύνολου σεναρίου στο Excel 2007

Δημιουργώντας μια αναφορά σύνολου σεναρίου στο Excel 2007

Μετά τη χρήση του σεναρίου διαχείρισης για να προσθέσετε σεναρίων σε έναν πίνακα σε ένα φύλλο εργασίας, μπορείτε να έχετε στο Excel 2007 μια συνοπτική αναφορά. Αυτή η αναφορά εμφανίζει τις μεταβαλλόμενες και τις προκύπτουσες τιμές όχι μόνο για όλα τα σενάρια που έχετε ορίσει, αλλά και τις τρέχουσες τιμές που εισάγονται στα μεταβαλλόμενα κελιά στον πίνακα φύλλου εργασίας ...

Δημιουργία προσαρμοσμένων αυτόματων φίλτρων για αριθμούς στο Excel 2007 - dummies

Δημιουργία προσαρμοσμένων αυτόματων φίλτρων για αριθμούς στο Excel 2007 - dummies

Εντοπίστε αρχεία που είτε ταιριάζουν με όλα τα κριτήρια είτε ικανοποιούν ένα ή τα άλλα κριτήρια. Μπορείτε να χρησιμοποιήσετε αυτήν τη μέθοδο όταν θέλετε να φιλτράρετε δεδομένα με βάση ένα εύρος τιμών (για παράδειγμα, μπορείτε να φιλτράρετε τιμές που είναι μεγαλύτερες ή ίσες με ...

Δημιουργία προσαρμοσμένων αυτόματων φίλτρων για κείμενο σε Excel 2007 - ανδρείκελα

Δημιουργία προσαρμοσμένων αυτόματων φίλτρων για κείμενο σε Excel 2007 - ανδρείκελα

Χρησιμοποιήστε το παράθυρο διαλόγου Custom Autofilter στο Excel 2007 εντοπίστε αρχεία που είτε ταιριάζουν με όλα τα κριτήρια είτε ικανοποιούν ένα ή τα άλλα κριτήρια. Μπορείτε να χρησιμοποιήσετε αυτήν τη μέθοδο για περισσότερη ευελιξία κατά το φιλτράρισμα κειμένου (για παράδειγμα, τα τελευταία ονόματα που αρχίζουν με το S αντί για μια συγκεκριμένη καταχώρηση κυττάρων όπως το Smith). Excel 2007 πίνακες αυτόματα ...

Η επιλογή των συντακτών

Βασικά στοιχεία δικτύου: Εγκατάσταση και χρήση TFTP - ανδρείκελοι

Βασικά στοιχεία δικτύου: Εγκατάσταση και χρήση TFTP - ανδρείκελοι

Οι διαχειριστές δικτύου πρέπει μερικές φορές να ενημερώσουν το Internetwork Operating System (IOS) αρχείο ή υλικολογισμικό μιας συσκευής Cisco. Η χρήση ενός διακομιστή TFTP είναι ο πιο συνηθισμένος τρόπος για να φτάσετε το αρχείο στη συσκευή δικτύου. Η Cisco χρησιμοποίησε για να παρέχει έναν δωρεάν διακομιστή TFTP που θα μπορούσε να κατεβάσει για να φορτώσει την εικόνα μέσω του διακομιστή, αλλά ...

Ανοιχτό πρωτόκολλο δρομολόγησης πιο σύντομης διαδρομής (OSPF) - ανδρείκελο

Ανοιχτό πρωτόκολλο δρομολόγησης πιο σύντομης διαδρομής (OSPF) - ανδρείκελο

Ένα πρωτόκολλο δρομολόγησης σύνδεσης-κατάστασης, παρά ένα πρωτόκολλο διάνυσμα εξ αποστάσεως. Η κύρια διαφορά εδώ είναι ότι ένα πρωτόκολλο συνδεδεμένης κατάστασης δεν στέλνει τον πίνακα δρομολόγησης με τη μορφή ενημερώσεων, αλλά μοιράζεται μόνο τη διαμόρφωση σύνδεσης. Μέσω της συλλογής πληροφοριών συνδεσιμότητας από όλες τις συσκευές στο δίκτυο, το OSPF ...

Πλεονεκτήματα και μειονεκτήματα της στατικής δρομολόγησης - ανδρείκελα

Πλεονεκτήματα και μειονεκτήματα της στατικής δρομολόγησης - ανδρείκελα

Διεπαφές πρωτόκολλων δρομολόγησης μπορούν να ανατεθούν δυναμικά ή στατικά. Η στατική δρομολόγηση δικτύου έχει πλεονεκτήματα και μειονεκτήματα σε σύγκριση με την εφαρμογή δυναμικών πρωτοκόλλων δρομολόγησης. Από την πλευρά των οφελών, έχετε τα εξής: Προβλεψιμότητα: Εάν αλλάξετε το σχεδιασμό και τη διάταξη του δικτύου σας και υποστείτε αποτυχία συσκευής, οι στατικές διαδρομές δεν αλλάζουν. Πάντα γνωρίζετε ...