Σπίτι Προσωπικά Οικονομικά Η ροή λατινικής εφαρμογής χοίρων σε Hadoop - dummies

Η ροή λατινικής εφαρμογής χοίρων σε Hadoop - dummies

Βίντεο: Ζωντανή ροή Hmerhsia Veroias 2025

Βίντεο: Ζωντανή ροή Hmerhsia Veroias 2025
Anonim

Στον πυρήνα του, το Pig Latin είναι μια γλώσσα ροή δεδομένων , όπου ορίζετε μια ροή δεδομένων και μια σειρά μετασχηματισμών που εφαρμόζονται στα δεδομένα μέσω της αίτησής σας. Αυτό έρχεται σε αντίθεση με μια γλώσσα ροής ελέγχου (όπως C ή Java), όπου γράφετε μια σειρά οδηγιών.

Στις γλώσσες ελέγχου ροής, χρησιμοποιείτε κατασκευές όπως βρόχους και λογική υπό όρους (όπως μια εντολή if). Δεν θα βρείτε βρόχους και αν δηλώσεις στη λατινική γλώσσα.

Αν χρειάζεστε κάποια πειστικά ότι η εργασία με το Pig είναι μια πολύ πιο εύκολη σειρά για να γουρουνάρετε από το να γράφετε Map και Reduce προγράμματα, ξεκινήστε ρίχνοντας μια ματιά σε κάποια πραγματική συνταγή Pig:

A = LOAD 'data_file. κείμενο';. Β = ΟΜΑΔΑ …; … C = ΦΙΛΤΡΟ …;. DUMP Β;. ΑΠΟΘΗΚΕΥΣΗ C INTO 'Αποτελέσματα';

Μερικά από τα κείμενα σε αυτό το παράδειγμα μοιάζουν πραγματικά με αγγλικά, σωστά; Δεν είναι πολύ τρομακτικό, τουλάχιστον σε αυτό το σημείο. Κοιτάζοντας κάθε γραμμή με τη σειρά της, μπορείτε να δείτε τη βασική ροή ενός προγράμματος χοίρων. (Σημειώστε ότι αυτός ο κώδικας μπορεί είτε να είναι μέρος ενός σεναρίου είτε να εκδοθεί στο διαδραστικό κέλυφος που ονομάζεται Grunt.)

  1. Φόρτωση: Αρχικά φορτώνετε (LOAD) τα δεδομένα που θέλετε να χειριστείτε.

    Όπως και σε μια τυπική εργασία MapReduce, τα δεδομένα αποθηκεύονται σε HDFS. Για ένα πρόγραμμα Pig για να έχετε πρόσβαση στα δεδομένα, πρώτα πείτε στο Pig τι είδους αρχείο ή αρχεία πρέπει να χρησιμοποιήσουν. Για αυτήν την εργασία, χρησιμοποιείτε την εντολή LOAD 'data_file'.

    Εδώ, το 'data_file' μπορεί να καθορίσει είτε ένα αρχείο HDFS είτε έναν κατάλογο. Εάν οριστεί ένας κατάλογος, όλα τα αρχεία στον κατάλογο αυτό φορτώνονται στο πρόγραμμα.

    Μετασχηματισμός: Εκτελείτε τα δεδομένα μέσω ενός συνόλου μετασχηματισμών που, με τον τρόπο κάτω από την κουκούλα και μακριά από οτιδήποτε πρέπει να ασχοληθείτε με τον εαυτό σας, μεταφράζονται σε ένα σύνολο χαρτών και μειώνουν τις εργασίες.
  2. Η λογική μετασχηματισμού είναι εκεί όπου συμβαίνει όλος ο χειρισμός δεδομένων. Εδώ μπορείτε να FILTER τις σειρές που δεν ενδιαφέρουν, JOIN δύο σύνολα αρχείων δεδομένων, τα στοιχεία GROUP για να δημιουργήσετε συγκεντρωτικά, ORDER αποτελέσματα, και να κάνουμε πολλά, πολύ περισσότερα.

    Έλλειψη: Τέλος, καταργείτε (DUMP) τα αποτελέσματα στην οθόνη
  3. ή

    Αποθηκεύστε

    (STORE) τα αποτελέσματα σε ένα αρχείο κάπου. Συνήθως χρησιμοποιείτε την εντολή DUMP για να στείλετε την έξοδο στην οθόνη όταν εντοπίζετε σφάλματα στα προγράμματα. Όταν το πρόγραμμά σας μπαίνει στην παραγωγή, απλώς αλλάζετε την κλήση DUMP σε μια κλήση STORE έτσι ώστε τα αποτελέσματα από την εκτέλεση των προγραμμάτων σας να αποθηκεύονται σε ένα αρχείο για περαιτέρω επεξεργασία ή ανάλυση.

Η ροή λατινικής εφαρμογής χοίρων σε Hadoop - dummies

Η επιλογή των συντακτών

Η ροή εφαρμογής MapReduce στο Hadoop - dummies

Η ροή εφαρμογής MapReduce στο Hadoop - dummies

Στον πυρήνα της, MapReduce είναι ένα μοντέλο προγραμματισμού για την επεξεργασία δεδομένων αποθηκεύονται κατά τρόπο κατανεμημένο σε όλους τους κόμβους του σκλάβου του συμπλέγματος του Hadoop. Η βασική ιδέα εδώ είναι η διάσπαση και η κατάκτηση. Συγκεκριμένα, θέλετε να σπάσετε ένα μεγάλο σύνολο δεδομένων σε πολλά μικρότερα κομμάτια και να τα επεξεργαστείτε παράλληλα με τον ίδιο αλγόριθμο. ...

Η ροή λατινικής εφαρμογής χοίρων σε Hadoop - dummies

Η ροή λατινικής εφαρμογής χοίρων σε Hadoop - dummies

Στον πυρήνα της, ορίζετε μια ροή δεδομένων και μια σειρά μετασχηματισμών που εφαρμόζονται στα δεδομένα καθώς περνάει μέσα από την εφαρμογή σας. Αυτό είναι σε αντίθεση με μια γλώσσα ροής ελέγχου (όπως C ή Java), όπου γράφετε μια σειρά οδηγιών. Στη ροή ελέγχου ...

Προγραμματισμός < < οι αρχές της Sqoop Design - dummies

Προγραμματισμός < < οι αρχές της Sqoop Design - dummies

Όταν πρόκειται για Sqoop, ελέγξτε την εικόνα, η οποία σας δίνει μια εικόνα του σπιτιού της αρχιτεκτονικής Sqoop. Η ιδέα πίσω από το Sqoop είναι ότι αξιοποιεί τα καθήκοντα χάρτη - τα καθήκοντα που εκτελούν την παράλληλη εισαγωγή και εξαγωγή των σχετικών βάσεων δεδομένων βάσης - ακριβώς από μέσα ...

Η επιλογή των συντακτών

Πώς να υπολογίσετε το ποσοστό απόδοσης του κεφαλαίου - ανδρείκελα

Πώς να υπολογίσετε το ποσοστό απόδοσης του κεφαλαίου - ανδρείκελα

Η επένδυση είναι λίγο δύσκολη και θα χρειαστείτε περισσότερα από τα QuickBooks. Σε όλες σχεδόν τις περιπτώσεις, χρειάζεστε είτε ένα οικονομικό αριθμομηχανή (ένα καλό) είτε ένα πρόγραμμα υπολογιστικών φύλλων, όπως το Microsoft Excel. Εάν δεν διαθέτετε Excel, θα πρέπει να είστε σε θέση να διαβάσετε σχεδόν όλα τα ...

Πώς να αντιστοιχίσετε έναν έλεγχο σε λογαριασμούς ή στοιχεία στο QuickBooks Online - dummies

Πώς να αντιστοιχίσετε έναν έλεγχο σε λογαριασμούς ή στοιχεία στο QuickBooks Online - dummies

Όταν γράψτε μια επιταγή στο QuickBooks Online (QBO), πρέπει να αντιστοιχίσετε το κόστος για το οποίο γράφετε την επιταγή είτε σε ένα λογαριασμό είτε σε ένα στοιχείο και μπορείτε να ορίσετε μία επιταγή στους λογαριασμούς και στα στοιχεία. Ακολουθήστε τα παρακάτω βήματα για να εισαγάγετε και να εκτυπώσετε μια επιταγή: Στη σελίδα Εξόδων συναλλαγών, κάντε κλικ στο ...

Πώς να υπολογίσετε τους βαθμούς ακεραιότητας στο QuickBook 2014 - ανδρείκελοι

Πώς να υπολογίσετε τους βαθμούς ακεραιότητας στο QuickBook 2014 - ανδρείκελοι

Ακόμη και το σημείο δείχνει τον όγκο των εσόδων από πωλήσεις που παράγει μηδενικό κέρδος και μηδενική απώλεια. Μπορείτε να υπολογίσετε τους βαθμούς σας στο QuickBooks. Θυμηθείτε τον τύπο για την ανάλυση κέρδους-όγκου-κόστους; Το ίδιο ισχύει και για τα κέρδη = (έσοδα από πωλήσεις x ποσοστό μικτού περιθωρίου) - σταθερό κόστος Αντί να υπολογίζουμε τα κέρδη με βάση το άλλο ...

Η επιλογή των συντακτών

Αναδιατάξετε τις παρουσιάσεις PowerPoint 2007 - dummies

Αναδιατάξετε τις παρουσιάσεις PowerPoint 2007 - dummies

Στο PowerPoint 2007 για να δείτε μια συνολική εικόνα της παρουσίασής σας, πρέπει να εργαστείτε στην προβολή διαλογής διαφανειών. Από εκεί μπορείτε να αναδιατάξετε τις διαφάνειες στην παρουσίαση του PowerPoint. Μπορείτε να μεταβείτε στην Προβολή διαλογής διαφανειών με δύο εύκολους τρόπους: Κάντε κλικ στο πλήκτρο διαλογής διαφανειών στη δεξιά πλευρά της γραμμής κατάστασης. Επιλέξτε ...

Επιλέξτε κείμενο στο PowerPoint 2007 - ανδρείκελα

Επιλέξτε κείμενο στο PowerPoint 2007 - ανδρείκελα

Επεξεργασίας κειμένου στο PowerPoint 2007 απαιτεί πρώτα να επιλέξετε το κείμενο. Η παρακάτω λίστα εμφανίζει μεθόδους για την επιλογή μπλοκ κειμένου σε διαφάνεια PowerPoint: Χρησιμοποιήστε το πληκτρολόγιο: Κρατήστε πατημένο το πλήκτρο Shift ενώ πατάτε οποιοδήποτε από τα πλήκτρα με τα βέλη για να μετακινήσετε το σημείο εισαγωγής. Χρησιμοποιήστε το ποντίκι: Σημείο στην αρχή ...

Επιλέξτε και επεξεργαστείτε διαφάνειες

Επιλέξτε και επεξεργαστείτε διαφάνειες

Όταν εργάζεστε με την καρτέλα PowerPoint Outline, επιλέξτε μια ολόκληρη διαφάνεια του PowerPoint , και κάντε κλικ στο εικονίδιο της διαφάνειας. Αυτό επιλέγει τον τίτλο διαφανειών PowerPoint και όλο το σώμα του. Οποιαδήποτε επιπλέον αντικείμενα, όπως γραφικά, στη διαφάνεια επιλέγονται ακόμη και αν τα αντικείμενα αυτά δεν εμφανίζονται στο περίγραμμα. Μπορείτε να διαγράψετε, ...