Σπίτι Προσωπικά Οικονομικά Εισαγωγή Αποκλεισμός σε Mapredduce του Hadoop - dummies

Εισαγωγή Αποκλεισμός σε Mapredduce του Hadoop - dummies

Βίντεο: Word 2010 - Εσοχές παραγράφων 2025

Βίντεο: Word 2010 - Εσοχές παραγράφων 2025
Anonim

Ο τρόπος που έχει ρυθμιστεί το HDFS, καταστρέφει τα πολύ μεγάλα αρχεία σε μεγάλα μπλοκ (για παράδειγμα, και αποθηκεύει τρία αντίγραφα αυτών των μπλοκ σε διαφορετικούς κόμβους του συμπλέγματος.Η HDFS δεν έχει επίγνωση του περιεχομένου αυτών των αρχείων

Στο YARN, όταν ξεκινά μια εργασία MapReduce, ο Διαχειριστής Πόρων (διαχείριση πόρων πόρων και προγραμματισμός εργασιών) δημιουργεί ένα δαίμονα Master Application για να μεριμνήσει για τον κύκλο ζωής της εργασίας. (Στο Hadoop 1, το JobTracker παρακολούθησε μεμονωμένες εργασίες καθώς και χειρισμό προγραμματισμού εργασιών και διαχείρισης πόρων cluster.)

> Ένα από τα πρώτα πράγματα που κάνει το Application Master είναι να καθορίσει ποια τμήματα αρχείων χρειάζονται για επεξεργασία.Το Master Application απαιτεί λεπτομέρειες από το όνομαNode όπου αποθηκεύονται τα αντίγραφα των απαραίτητων μπλοκ δεδομένων. Ο υπεύθυνος εφαρμογής υποβάλλει αιτήσεις στον πόρο Διαχειριστής για να εκτελέσει εργασίες χαρτογράφησης συγκεκριμένων μπλοκ στους κόμβους σκλάβων όπου είναι αποθηκευμένοι.

τοπικά

στον κόμβο υποτελούς όπου είναι αποθηκευμένα. Πριν εξετάσετε πώς επεξεργάζονται τα μπλοκ δεδομένων, θα πρέπει να εξετάσετε προσεκτικότερα τον τρόπο αποθήκευσης των δεδομένων από τον Hadoop. Στο Hadoop, τα αρχεία αποτελούνται από μεμονωμένα αρχεία, τα οποία τελικά επεξεργάζονται ένα προς ένα από τις εργασίες χαρτογράφησης. Για παράδειγμα, το δείγμα δεδομένων περιέχει πληροφορίες σχετικά με τις ολοκληρωμένες πτήσεις εντός των Ηνωμένων Πολιτειών μεταξύ 1987 και 2008.

Για να κάνετε λήψη του δείγματος δεδομένων, ανοίξτε το πρόγραμμα περιήγησης Firefox μέσα από το VM και μεταβείτε στη σελίδα dataexpo.

Έχετε ένα μεγάλο αρχείο για κάθε έτος, και μέσα σε κάθε αρχείο, κάθε μεμονωμένη γραμμή αντιπροσωπεύει μια μόνο πτήση. Με άλλα λόγια, μία γραμμή αντιπροσωπεύει ένα αρχείο. Τώρα, να θυμάστε ότι το μέγεθος μπλοκ για το σύμπλεγμα Hadoop είναι 64MB, πράγμα που σημαίνει ότι τα αρχεία δεδομένων φωτός χωρίζονται σε κομμάτια ακριβώς 64MB.

Βλέπετε το πρόβλημα; Εάν κάθε εργασία χαρτών επεξεργάζεται όλες τις εγγραφές σε ένα συγκεκριμένο μπλοκ δεδομένων, τι συμβαίνει σε αυτές τις εγγραφές που καλύπτουν τα όρια; Τα μπλοκ αρχείων είναι ακριβώς 64MB (ή ό, τι ρυθμίζετε το μέγεθος του μπλοκ) και επειδή το HDFS δεν έχει αντίληψη για τα περιεχόμενα των μπλοκ αρχείων, δεν μπορεί να μετρήσει όταν ένα αρχείο μπορεί να μεταφερθεί σε άλλο μπλοκ.

Για την επίλυση αυτού του προβλήματος, ο Hadoop χρησιμοποιεί μια λογική αναπαράσταση των δεδομένων που είναι αποθηκευμένα σε μπλοκ αρχείων, γνωστά ως

σχισμές εισόδου

. Όταν ένας πελάτης εργασίας MapReduce υπολογίζει τις διαφορές εισόδου, υπολογίζει πού αρχίζει η πρώτη ολόκληρη εγγραφή σε ένα μπλοκ και πού τελειώνει η τελευταία εγγραφή στο μπλοκ. Σε περιπτώσεις όπου η τελευταία εγγραφή σε ένα μπλοκ είναι ατελής, ο διαχωρισμός εισόδου περιλαμβάνει πληροφορίες θέσης για το επόμενο μπλοκ και την απόκλιση byte των δεδομένων που απαιτούνται για την ολοκλήρωση της εγγραφής. Το σχήμα δείχνει αυτή τη σχέση μεταξύ των μπλοκ δεδομένων και των χωρισμάτων εισόδου.

Μπορείτε να διαμορφώσετε τον δαίμονα Application Master (ή το JobTracker, εάν βρίσκεστε στο Hadoop 1) για να υπολογίσετε τις χωρίσεις εισόδου αντί του πελάτη εργασίας, κάτι που θα ήταν πιο γρήγορο για εργασίες που επεξεργάζονται μεγάλο αριθμό μπλοκ δεδομένων.

Η επεξεργασία δεδομένων MapReduce οδηγείται από αυτή την έννοια των διαφορών εισόδου. Ο αριθμός των διαχωρισμών εισόδου που υπολογίζονται για μια συγκεκριμένη εφαρμογή καθορίζει τον αριθμό των εργασιών χαρτογράφησης. Κάθε μία από αυτές τις εργασίες χαρτογράφησης αντιστοιχεί, όπου είναι δυνατόν, σε έναν κόμβο υποτελούς λειτουργίας στον οποίο αποθηκεύεται ο διαχωρισμός εισόδου. Ο Διαχειριστής Πόρων (ή το JobTracker, αν βρίσκεστε στο Hadoop 1) προσπαθεί να διασφαλίσει ότι οι διαχωρίσεις εισερχόμενων δεδομένων θα υποστούν επεξεργασία τοπικά.

Εισαγωγή Αποκλεισμός σε Mapredduce του Hadoop - dummies

Η επιλογή των συντακτών

Πώς να αλληλεπιδράσετε με το Facebook News Feed - dummies

Πώς να αλληλεπιδράσετε με το Facebook News Feed - dummies

Σε αντίθεση με την εφημερίδα στο κατώφλι σας το πρωί, Η News Feed δεν είναι απλώς μια μέθοδος παράδοσης ειδήσεων. Είναι στην πραγματικότητα περισσότερο ένα σημείο εκκίνησης, που έχει ως στόχο να διευκολύνει περισσότερες αλληλεπιδράσεις μεταξύ εσάς και των φίλων σας. Κάθε ιστορία έχει τρεις επιλογές στο κάτω μέρος της: Όπως, Σχόλιο και Κοινή χρήση. Κάθε μία από αυτές τις επιλογές ...

Πώς να διαχειριστείτε τις εκδηλώσεις στο Facebook - ανδρείκελα

Πώς να διαχειριστείτε τις εκδηλώσεις στο Facebook - ανδρείκελα

Μπορεί να χρειαστεί να διαχειριστεί μερικά πράγματα. Ίσως χρειαστεί να δώσετε περισσότερες πληροφορίες ή να αλλάξετε την τοποθεσία για να φιλοξενήσετε περισσότερα άτομα. Εάν πρόκειται για ένα μεγάλο δημόσιο γεγονός, ίσως χρειαστεί να κάνετε κάποια μετριοπάθεια των ανθρώπων που δημοσιεύουν. Εδώ είναι κάποια κοινή διαχείριση ...

Η επιλογή των συντακτών

Προσδιορίζοντας το κοινό για τα Κοράνι - ανδρείκελα

Προσδιορίζοντας το κοινό για τα Κοράνι - ανδρείκελα

Το κοινό του Κορανίου είναι καθολικό, χωρίς περιορισμό φύλου, θρησκευτικες πεποιθησεις. Ωστόσο, το Κοράνι απευθύνεται ειδικά σε έξι γενικές ομάδες ανθρώπων σε διάφορα χωρία και σε ποικίλα μήκη: Ανθρωπότητα: Αυτοί οι στίχοι συνήθως φέρουν καθολικές διδασκαλίες, προειδοποιήσεις και ευτυχείς προφητείες. Τέτοια περάσματα αρχίζουν συνήθως με "O ανθρωπότητα" ή "O παιδιά του Αδάμ. "Βρίσκεσαι ...

Γνωρίζοντας διάσημους σχολιαστές του Κορανίου - ανδρείκελα

Γνωρίζοντας διάσημους σχολιαστές του Κορανίου - ανδρείκελα

Την ημέρα που ο Προφήτης Μωάμεθ πέθανε, μια κατάσταση χάους? για πρώτη φορά, οι μουσουλμάνοι είχαν ερωτήσεις που δεν μπορούσαν να απαντηθούν απευθείας από τον Θεό μέσω του Προφήτη. Κατά τη διάρκεια αυτής της κρίσιμης εποχής, ο Abu Bakr (ένας στενός σύντροφος του Προφήτη Μωάμεθ και ο πρώτος Χαλίφ μετά τον θάνατο του Προφήτη) στάθηκε μπροστά στους μουσουλμάνους ...

Ανακαλύπτοντας Περισσότερα για τα Κοράνι - ανδρείκελα

Ανακαλύπτοντας Περισσότερα για τα Κοράνι - ανδρείκελα

Η ισλαμική παράδοση περιγράφει το Κοράνι ως έναν απέραντο ωκεανό γνώσης που δεν παύει ποτέ τη σοφία του, ανεξάρτητα από το πόσο σπουδάζετε. Μπορεί να θέλετε να συνεχίσετε να διερευνείτε το Κοράνι, αναζητώντας νέες προοπτικές, προκλήσεις και ιδέες. Συγκρίνοντας τις "μεταφράσεις" Μπορείτε να βρείτε πολλές "μεταφράσεις" του Κορανίου σε οποιοδήποτε σημαντικό βιβλιοπωλείο. Μην ...

Η επιλογή των συντακτών

Πώς να ρυθμίσετε τον εκτυπωτή για εκτύπωση QuickBooks 2015 Τιμολόγια - ανδρείκελα

Πώς να ρυθμίσετε τον εκτυπωτή για εκτύπωση QuickBooks 2015 Τιμολόγια - ανδρείκελα

Τα τιμολόγια εκτύπωσης από το QuickBooks 2015, πρέπει να ρυθμίσετε τον εκτυπωτή τιμολογίων μόνο μία φορά, αλλά πρέπει να ορίσετε μια χούφτα γενικούς κανόνες εκτύπωσης τιμολογίου. Αυτοί οι κανόνες ισχύουν επίσης για τα πιστωτικά σημειώματα και τις εντολές αγοράς, παρεμπιπτόντως. Για να ρυθμίσετε τον εκτυπωτή σας για εκτύπωση τιμολογίου, ακολουθήστε τα παρακάτω βήματα: Επιλέξτε ...

Πώς να ρυθμίσετε τον κατάλογο λογαριασμών QuickBooks 2013 - ανδρείκελα

Πώς να ρυθμίσετε τον κατάλογο λογαριασμών QuickBooks 2013 - ανδρείκελα

Λίστα στο QuickBooks 2013 είναι μια λίστα λογαριασμών που χρησιμοποιείτε για να κατηγοριοποιήσετε τα έσοδα, τα έξοδα, τα περιουσιακά στοιχεία, τις υποχρεώσεις σας και τα ποσά των ιδίων κεφαλαίων. Αν θέλετε να δείτε ένα συγκεκριμένο στοιχείο γραμμής οικονομικών στοιχείων σε μια αναφορά, χρειάζεστε έναν λογαριασμό για αυτό το στοιχείο γραμμής. Αν θέλετε να πληρώσετε τον προϋπολογισμό ...

Πώς να ταξινομήσετε τις λίστες QuickBooks Online - dummies

Πώς να ταξινομήσετε τις λίστες QuickBooks Online - dummies

Μπορείτε να χρησιμοποιήσετε τις σελίδες Πελατών, Προμηθευτών και Εργοδοτών στο QuickBooks Online (QBO) με διάφορους τρόπους. Για παράδειγμα, μπορείτε να ταξινομήσετε τα άτομα που εμφανίζονται στη λίστα. Μπορείτε να ταξινομήσετε τις λίστες στη σελίδα Πελάτες και Προμηθευτές με βάση το όνομα, την εταιρεία, το ληξιαρχικό υπόλοιπο ή το υπόλοιπο. Από προεπιλογή, το QBO ταξινομεί τις καταχωρήσεις ...