Σπίτι Προσωπικά Οικονομικά Παρακολουθήστε Blocks δεδομένων με όνομαNode σε HDFS - dummies

Παρακολουθήστε Blocks δεδομένων με όνομαNode σε HDFS - dummies

Πίνακας περιεχομένων:

Βίντεο: Big Data Analytics Lectures | Introduction to Hadoop in Hindi| Part 1 2024

Βίντεο: Big Data Analytics Lectures | Introduction to Hadoop in Hindi| Part 1 2024
Anonim

Το NameNode λειτουργεί ως βιβλίο διευθύνσεων για το Distributed File System (HDFS) επειδή δεν γνωρίζει μόνο τα μπλοκ που απαρτίζουν τα μεμονωμένα αρχεία, αλλά και όπου αποθηκεύονται καθένα από αυτά τα μπλοκ και τα αντίγραφα τους. Όταν ένας χρήστης αποθηκεύει ένα αρχείο σε HDFS, το αρχείο χωρίζεται σε μπλοκ δεδομένων και τρία αντίγραφα αυτών των μπλοκ δεδομένων αποθηκεύονται σε κόμβους υποτελών σε ολόκληρο το σύμπλεγμα Hadoop.

Είναι πολλά μπλοκ δεδομένων για να παρακολουθείτε. Όπως μπορείτε να περιμένετε, γνωρίζοντας πού θάβονται τα σώματα, το NameNode είναι ένα κρίσιμο στοιχείο σε ένα cluster Hadoop. Εάν το ΌνομαNode δεν είναι διαθέσιμο, οι εφαρμογές δεν μπορούν να έχουν πρόσβαση σε δεδομένα αποθηκευμένα σε HDFS.

Εάν δείτε το παρακάτω σχήμα, μπορείτε να δείτε τον δαίμονα NameNode που εκτελείται σε έναν κεντρικό διακομιστή κόμβων. Όλες οι πληροφορίες χαρτογράφησης που ασχολούνται με τα μπλοκ δεδομένων και τα αντίστοιχα αρχεία τους αποθηκεύονται σε ένα αρχείο που ονομάζεται.

Το HDFS είναι ένα σύστημα αρχειοθέτησης αρχειοθέτησης, το οποίο σημαίνει ότι όλες οι αλλαγές δεδομένων καταγράφονται σε ένα περιοδικό επεξεργασίας που παρακολουθεί γεγονότα από το τελευταίο σημείο ελέγχου - την τελευταία φορά που συγχωνεύθηκε το αρχείο καταγραφής επεξεργασίας. Σε HDFS, το περιοδικό επεξεργασίας διατηρείται σε ένα αρχείο που ονομάζεται που είναι αποθηκευμένο στο ΌνομαNode.

ΌνομαNode εκκίνηση και λειτουργία

Για να κατανοήσετε πώς λειτουργεί το όνομαNode, είναι χρήσιμο να ρίξετε μια ματιά στο πώς ξεκινάει. Επειδή ο σκοπός του NameNode είναι να ενημερώνει τις εφαρμογές για το πόσα μπλοκ δεδομένων χρειάζονται για να επεξεργαστεί και να παρακολουθεί την ακριβή τοποθεσία όπου είναι αποθηκευμένα, χρειάζεται όλες τις τοποθεσίες μπλοκ και τις αντιστοιχίσεις μπλοκ σε αρχείο που είναι διαθέσιμες στο ΕΜΒΟΛΟ.

Αυτά είναι τα βήματα που λαμβάνει το ΌνομαNode. Για να φορτώσετε όλες τις πληροφορίες που χρειάζεται το ΌνομαNode μετά την εκκίνηση, συμβαίνουν τα εξής:

  1. Το όνομαNode φορτώνει το αρχείο στη μνήμη.

  2. Το NameNode φορτώνει το αρχείο και επαναλαμβάνει τις αλλαγές που έχουν καταχωρηθεί για να ενημερώσει τα μεταδεδομένα μπλοκ που είναι ήδη στη μνήμη.

  3. Οι δαίμονες DataNode στέλνουν τις αναφορές ομάδων NameNode.

    Για κάθε κόμβο υποτελούς, υπάρχει μια αναφορά μπλοκ που απαριθμεί όλα τα μπλοκ δεδομένων που είναι αποθηκευμένα εκεί και περιγράφει την υγεία του καθενός.

Μετά την ολοκλήρωση της διαδικασίας εκκίνησης, το NameNode έχει πλήρη εικόνα όλων των δεδομένων που είναι αποθηκευμένα σε HDFS και είναι έτοιμο να λάβει αιτήματα εφαρμογών από πελάτες Hadoop.

Δεδομένου ότι τα αρχεία δεδομένων προστίθενται και καταργούνται με βάση τα αιτήματα των πελατών, οι αλλαγές γράφονται στους τόμους των δίσκων του κόμβου του σκλάβου, πραγματοποιούνται ενημερώσεις περιοδικών στο αρχείο και οι αλλαγές αντανακλώνται στις θέσεις μπλοκ και τα μεταδεδομένα που είναι αποθηκευμένα στη μνήμη του ΌνομαNode.

Καθ 'όλη τη διάρκεια ζωής του συμπλέγματος, οι δαίμονες DataNode στέλνουν κάθε 3 δευτερόλεπτα τους κτύπους του ονόματος (γρήγορο σήμα), υποδεικνύοντας ότι είναι ενεργοί.(Αυτή η προεπιλεγμένη τιμή είναι ρυθμιζόμενη.) Κάθε έξι ώρες (και πάλι, μια προεπιλεγμένη ρύθμιση), τα DataNodes στέλνουν στο NameNode μια αναφορά μπλοκ που περιγράφει τα μπλοκ αρχείων που βρίσκονται στους κόμβους τους. Με αυτό τον τρόπο, το ΌνομαNode έχει πάντα μια τρέχουσα άποψη των διαθέσιμων πόρων στο σύμπλεγμα.

Για να δημιουργήσετε νέα αρχεία σε HDFS, θα πρέπει να πραγματοποιηθεί η ακόλουθη διαδικασία:

Ο πελάτης στέλνει ένα αίτημα στο ΌνομαNode για να δημιουργήσει ένα νέο αρχείο.

  1. Το όνομαNode καθορίζει πόσα μπλοκ είναι απαραίτητα και ο πελάτης λαμβάνει

    μίσθωση για τη δημιουργία αυτών των νέων μπλοκ αρχείων στο σύμπλεγμα. Ως μέρος αυτής της μίσθωσης, ο πελάτης έχει ένα χρονικό όριο για να ολοκληρώσει την εργασία δημιουργίας. (Αυτό το χρονικό όριο εξασφαλίζει ότι ο αποθηκευτικός χώρος δεν απορροφάται από τις αποτυχημένες εφαρμογές πελάτη.) Ο πελάτης τότε γράφει τα πρώτα αντίγραφα των μπλοκ αρχείων στους κόμβους slave χρησιμοποιώντας τη μίσθωση που έχει εκχωρηθεί από το όνομαNode.

  2. Το NameNode χειρίζεται τις αιτήσεις εγγραφής και καθορίζει πού πρέπει να γράφονται τα μπλοκ αρχείων και τα αντίγραφα τους, εξισορροπώντας τη διαθεσιμότητα και την απόδοση. Το πρώτο αντίγραφο ενός μπλοκ αρχείου γράφεται σε ένα rack και το δεύτερο και το τρίτο αντίγραφο γράφονται σε διαφορετικό rack από το πρώτο αντίγραφο, αλλά σε διαφορετικούς κόμβους υποτελούς στο ίδιο rack. Αυτή η διάταξη ελαχιστοποιεί την κυκλοφορία του δικτύου ενώ εξασφαλίζει ότι δεν υπάρχουν μπλοκ δεδομένων στο ίδιο σημείο αποτυχίας.

    Καθώς κάθε μπλοκ γράφεται σε HDFS, μια ειδική διαδικασία γράφει τα υπόλοιπα αντίγραφα στους άλλους κόμβους υποτελούς που προσδιορίζονται από το όνομαNode.

  3. Αφού οι δαίμονες DataNode επιβεβαιώσουν ότι έχουν δημιουργηθεί τα αντίγραφα μπλοκαρχείων αρχείων, η εφαρμογή-πελάτης κλείνει το αρχείο και ειδοποιεί το όνομαNode, το οποίο στη συνέχεια κλείνει την ανοιχτή μίσθωση.

  4. Ανάγνωση δεδομένων

Για να διαβάσετε αρχεία από HDFS, θα πρέπει να πραγματοποιηθεί η ακόλουθη διαδικασία:

Ο πελάτης στέλνει ένα αίτημα στο όνομαNode για ένα αρχείο.

  1. Ο ΌνομαNode καθορίζει ποια τμήματα εμπλέκονται και επιλέγει, με βάση τη συνολική εγγύτητα των μπλοκ μεταξύ τους και με τον πελάτη, την πιο αποτελεσματική διαδρομή πρόσβασης.

    Ο πελάτης κατόπιν αποκτά πρόσβαση στα μπλοκ χρησιμοποιώντας τις διευθύνσεις που δίδονται από τον ΌνομαNode.

  2. Εξισορρόπηση δεδομένων στο σύμπλεγμα Hadoop

Με την πάροδο του χρόνου, με συνδυασμούς άνισων προτύπων λήψης δεδομένων (όπου μερικοί κόμβοι υποτελούς μπορεί να έχουν περισσότερα δεδομένα γραμμένα σε αυτά) ή αποτυχίες κόμβων, τα δεδομένα πιθανόν να κατανέμονται ανομοιόμορφα στα ράφια και υποτελείς κόμβους στο σύμπλεγμα Hadoop.

Αυτή η ανομοιογενής κατανομή μπορεί να έχει επιζήμιες επιπτώσεις στην απόδοση, επειδή η ζήτηση σε μεμονωμένους κόμβους υποτελούς θα γίνει ασύμμετρη. οι κόμβοι με ελάχιστα δεδομένα δεν θα χρησιμοποιηθούν πλήρως. και οι κόμβοι με πολλά μπλοκ θα χρησιμοποιηθούν υπερβολικά. (Σημείωση: Η υπερχρησιμοποίηση και η υποεκτέλεση βασίζονται στη δραστηριότητα του δίσκου και όχι στη CPU ή τη μνήμη RAM.) Το HDFS περιλαμβάνει ένα βοηθητικό πρόγραμμα εξισορρόπησης για την αναδιανομή μπλοκ από υπερφόρτωτους κόμβους μπλοκ σε διαφορετικούς κόμβους και σχάρες. Οι διαχειριστές του Hadoop θα πρέπει να ελέγχουν τακτικά την υγεία των HDFS και αν τα δεδομένα διανέμονται άνισα, θα πρέπει να επικαλούνται το βοηθητικό πρόγραμμα εξισορρόπησης.

Σχεδίαση αρχικού εξυπηρετητή NameNode

Λόγω της κρίσιμης σημασίας του χαρακτήρα του, ο κύριος διακομιστής που εκτελεί τον δαίμονα NameNode χρειάζεται σημαντικά διαφορετικές απαιτήσεις υλικού από εκείνες για ένα υποτελές κόμβο. Πιο σημαντικά, πρέπει να χρησιμοποιηθούν εξαρτήματα σε επίπεδο επιχείρησης για την ελαχιστοποίηση της πιθανότητας διακοπής. Επίσης, θα χρειαστεί αρκετή μνήμη RAM για να φορτώσετε στη μνήμη όλα τα δεδομένα μεταδεδομένων και τοποθεσίας για όλα τα μπλοκ δεδομένων που είναι αποθηκευμένα σε HDFS.

Παρακολουθήστε Blocks δεδομένων με όνομαNode σε HDFS - dummies

Η επιλογή των συντακτών

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Οι πιο βασικές ηλεκτρονικές χρήσεις ενός ενισχυτή Op είναι ως ενισχυτής. Εάν συνδέσετε μια πηγή εισόδου σε έναν από τους ακροδέκτες εισόδου και γειώσετε τον άλλο ακροδέκτη εισόδου, εμφανίζεται μια ενισχυμένη έκδοση του σήματος εισόδου στο εξωτερικό τερματικό. Μια σημαντική ιδέα στα κυκλώματα op-amp ...

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Για την οικοδόμηση ενός πραγματικού ηλεκτρονικού κυκλώματος χρησιμοποιώντας Op-amp, φυσικά, θα πρέπει να χρησιμοποιήσετε ένα πραγματικό ενισχυτή op. Ευτυχώς, τα ενσωματωμένα ολοκληρωμένα κυκλώματα (IC) είναι άφθονα και σχεδόν όλα τα καταστήματα που πωλούν ηλεκτρονικά εξαρτήματα πωλούν διάφορους τύπους φθηνών IC-ενισχυτών. Το πιο δημοφιλές op-amp IC είναι το LM741, το οποίο έρχεται ...

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

. Η ακριβής κυματομορφή που παράγεται εξαρτάται από τον τύπο του κυκλώματος που χρησιμοποιείται για τη δημιουργία του ταλαντωτή. Ένα από τα συνηθέστερα χρησιμοποιούμενα κυκλώματα ταλαντωτών είναι κατασκευασμένο από ένα ζεύγος τρανζίστορ που είναι εφοδιασμένα για να εναλλάσσονται και να σβήνουν εναλλάξ. Αυτός ο τύπος κυκλώματος είναι ...

Η επιλογή των συντακτών

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Η ασήμαντη εκπαίδευση είναι ένα σημαντικό βήμα στην ανάπτυξη των παιδιών. Ως γονέας, θα πρέπει να αναγνωρίσετε τα σημάδια ότι το παιδί σας είναι έτοιμο για την ομιλία της τουαλέτας, να ξεκινήσει μια διαδικασία ασήμαντης κατάρτισης, να συνεχίσει τη διαδικασία και να αναγνωρίσει πότε το παιδί σας είναι σχεδόν εκεί. Κατά τη διάρκεια της διαδρομής, πρέπει να σιγουρευτείτε ότι το παιδί σας ξέρει ...

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Παιδιά, ανάλογα με την αναπηρία. Μπορεί να χρειαστεί να παρέχετε στηρίγματα υψηλής τεχνολογίας που διευκολύνουν την κίνηση από τον περιπατητή ή την αναπηρική καρέκλα στην τουαλέτα (δείτε την ενότητα "Εργασία με ειδικό εργαλείο" σε αυτό το άρθρο.) Από την άλλη πλευρά, το παιδί σας μπορεί να ...

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Την ημέρα που κάθε γονιός επιθυμεί, αλλά δεν μπορείτε να βιάσετε τη διαδικασία. Περιμένετε τα σημάδια ότι το παιδί σας είναι έτοιμο να αντιμετωπίσει αυτή τη μεγάλη πρόκληση. Παρακολουθήστε τα σημεία στην παρακάτω λίστα. οι πρώτες πέντε είναι απολύτως απαραίτητες: μένει ξηρό τουλάχιστον δύο ώρες παίρνει Bummed από υγρό ή ...

Η επιλογή των συντακτών

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Αναδυόμενο πεδίο της ιατρικής μυαλού-σώματος υπενθυμίζει στους ανθρώπους - και γιόγκι και σοφοί έχουν πει για χιλιετίες - το σώμα σας, το μυαλό σας και η καρδιά σας αποτελούν ένα ενιαίο και αδιάσπαστο σύνολο. Όταν οι σκέψεις σας συνεχίζουν να σφύζουν από την ανησυχία σας, το σώμα σας αποκρίνεται με τη σύσφιξη και την τάνυση, ειδικά σε ορισμένες σημαντικές θέσεις ...

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πόνος είναι κάτι που θα αντιμετωπίσει κάποιος σε κάποιο σημείο . Η προσοχή μπορεί να σας βοηθήσει να προσεγγίσετε πόνο με υγιεινό τρόπο. Ο οξύς πόνος είναι ένας αιχμηρός πόνος που διαρκεί για μικρό χρονικό διάστημα, μερικές φορές ορίζεται ως λιγότερο από 12 εβδομάδες. Η ιατρική είναι αρκετά καλή για τη θεραπεία του οξέος πόνου. Ο χρόνιος πόνος είναι ο πόνος που διαρκεί ...

Βελτίωση των σχέσεών σας - ανδρείκεS

Βελτίωση των σχέσεών σας - ανδρείκεS

Σχέσεις - είτε με την οικογένεια, τους φίλους ή τους εραστές; Και δεν έχει σημασία πόσο χαρούμενος και ευχαριστημένος είστε με τις σημαντικές σχέσεις στη ζωή σας, υπάρχει πάντα περιθώριο βελτίωσης. Οι σχέσεις, όπως όλες οι διεργασίες, επίσης καταλήγουν και ρέουν και σας παρουσιάζουν προκλήσεις. Εδώ είναι μερικές εξαιρετικές τεχνικές για να σας βοηθήσουμε ...