Σπίτι Προσωπικά Οικονομικά Hadoop Ενσωμάτωση με R-dummies

Hadoop Ενσωμάτωση με R-dummies

Πίνακας περιεχομένων:

Βίντεο: Hadoop Rack Awareness 2024

Βίντεο: Hadoop Rack Awareness 2024
Anonim

Στην αρχή, τα μεγάλα δεδομένα και οι R δεν ήταν φυσικοί φίλοι. R προγραμματισμού απαιτεί να φορτώνονται όλα τα αντικείμενα στην κύρια μνήμη ενός μόνο μηχανήματος. Οι περιορισμοί αυτής της αρχιτεκτονικής πραγματοποιούνται γρήγορα όταν μεγάλα δεδομένα γίνονται μέρος της εξίσωσης.

Αντίθετα, τα κατανεμημένα συστήματα αρχείων όπως ο Hadoop στερούνται ισχυρές στατιστικές τεχνικές, αλλά είναι ιδανικές για την κλιμάκωση σύνθετων λειτουργιών και εργασιών. Οι κατακόρυφες λύσεις κλιμάκωσης - που απαιτούν επένδυση σε δαπανηρό υλικό υπερυπολογιστών - συχνά δεν μπορούν να ανταγωνιστούν με την απόδοση κόστους-κόστους που προσφέρουν τα κατανεμημένα συμπλέγματα υλικών βασικών προϊόντων.

Αυτό επιτεύχθηκε με τη χρήση συστημάτων μετάδοσης μηνυμάτων και τηλεειδοποίησης. Αυτή η τεχνική είναι σε θέση να διευκολύνει την εργασία πάνω σε σύνολα δεδομένων που είναι πολύ μεγάλα για να αποθηκεύονται ταυτόχρονα στην κύρια μνήμη. Ωστόσο, η προσέγγιση προγραμματισμού χαμηλού επιπέδου παρουσιάζει μια απότομη καμπύλη μάθησης για όσους δεν είναι εξοικειωμένοι με παραδείγματα παράλληλου προγραμματισμού.

Για προγραμματιστές που επιθυμούν να προγραμματίσουν εργασίες MapReduce σε γλώσσες (συμπεριλαμβανομένου του R) εκτός από την Java, μια δεύτερη επιλογή είναι να χρησιμοποιήσετε το API Streaming του Hadoop. Οι εργασίες MapReduce που υποβάλλονται από το χρήστη υποβάλλονται σε μετασχηματισμούς δεδομένων με τη βοήθεια τυπικών ροών UNIX και σειριοποίησης, διασφαλίζοντας την είσοδο που είναι συμβατή με την Java στον Hadoop - ανεξάρτητα από τη γλώσσα που εισήγαγε ο προγραμματιστής.

Οι προγραμματιστές συνεχίζουν να διερευνούν διάφορες στρατηγικές για να αξιοποιήσουν τη κατανεμημένη ικανότητα υπολογισμού του MapReduce και την σχεδόν απεριόριστη χωρητικότητα αποθήκευσης των HDFS με τρόπους που μπορούν να αξιοποιηθούν από το R.

Η ενσωμάτωση του Hadoop με το R είναι σε εξέλιξη, με προσφορές διαθέσιμες από την IBM (Big R ως μέρος των BigInsights) και Revolution Analytics (Revolution R Enterprise). Προσφέρονται επίσης λύσεις γεφύρωσης που ενσωματώνουν προγραμματισμό υψηλού επιπέδου και γλώσσες αναζήτησης με το Hadoop, όπως το RHive και το RHadoop.

Βασικά, κάθε σύστημα στοχεύει να προσφέρει τις βαθιές αναλυτικές δυνατότητες της γλώσσας R σε πολύ μεγαλύτερα σύνολα δεδομένων.

RHive

Το πλαίσιο RHive χρησιμεύει ως γέφυρα μεταξύ της γλώσσας R και της κυψέλης. Το RHive παραδίδει τις πλούσιες στατιστικές βιβλιοθήκες και τους αλγορίθμους του R σε δεδομένα που είναι αποθηκευμένα στο Hadoop, επεκτείνοντας την γλώσσα ερωτημάτων τύπου Hive (HiveQL) της Hive με λειτουργίες που σχετίζονται με την R. Μέσω των λειτουργιών RHive, μπορείτε να χρησιμοποιήσετε την εφαρμογή HiveQL για να εφαρμόσετε R στατιστικά μοντέλα στα δεδομένα στο σύμπλεγμα Hadoop που έχετε καταγράψει χρησιμοποιώντας το Hive.

RHadoop

Ένα άλλο πλαίσιο ανοιχτού κώδικα που διατίθεται στους προγραμματιστές R είναι το RHadoop, μια συλλογή πακέτων που προορίζονται για τη διαχείριση της διανομής και της ανάλυσης δεδομένων με τον Hadoop. Τρία πακέτα σημείωσης - rmr2, rhdfs και rhbase - παρέχουν το μεγαλύτερο μέρος της λειτουργικότητας του RHadoop:

rmr2:

Το πακέτο rmr2 υποστηρίζει τη μετάφραση της γλώσσας R στις χαρτογραφικές εργασίες Hadoop (δημιουργώντας αποδοτικό κώδικα MapReduce χαμηλού επιπέδου από κωδικό R υψηλότερου επιπέδου).

  • rhdfs: Το πακέτο rhdfs παρέχει ένα API γλώσσας R για τη διαχείριση αρχείων σε καταστήματα HDFS. Χρησιμοποιώντας rhdfs, οι χρήστες μπορούν να διαβάσουν από καταστήματα HDFS σε ένα πλαίσιο δεδομένων R (μήτρα) και να γράψουν παρόμοια δεδομένα από αυτές τις μήτρες R πίσω στην αποθήκευση HDFS.

  • rhbase: Τα πακέτα rhbase παρέχουν επίσης API γλώσσας R, αλλά ο στόχος τους στη ζωή είναι να ασχοληθούν με τη διαχείριση βάσεων δεδομένων για τα καταστήματα HBase αντί για τα αρχεία HDFS.

  • Revolution R Η Revolution R (από την Revolution Analytics) είναι μια εμπορική προσφορά R με υποστήριξη για την ενσωμάτωση R σε κατανεμημένα συστήματα Hadoop. Η Revolution R υπόσχεται να προσφέρει βελτιωμένες επιδόσεις, λειτουργικότητα και χρηστικότητα για τον R on Hadoop. Για να παρέχει βαθιά αναλυτικά στοιχεία, όπως το R, η Revolution R χρησιμοποιεί τη βιβλιοθήκη ScaleR της εταιρείας - μια συλλογή αλγορίθμων στατιστικής ανάλυσης που αναπτύσσονται ειδικά για μεγάλες συλλογές δεδομένων σε επιχειρήσεις.

Η ScaleR στοχεύει στην γρήγορη εκτέλεση του κώδικα προγράμματος R σε ομάδες συμπλέγματος Hadoop, επιτρέποντας στον προγραμματιστή R να επικεντρωθεί αποκλειστικά στους στατιστικούς αλγόριθμους και όχι στον MapReduce. Επιπλέον, χειρίζεται πολλά καθήκοντα ανάλυσης, όπως προετοιμασία δεδομένων, οπτικοποίηση και στατιστικές δοκιμές.

IBM BigInsights Big R

Το Big R προσφέρει ολοκλήρωση μεταξύ της R και της προσφοράς Hadoop της IBM, BigInsights, που επιτρέπει στους προγραμματιστές R να αναλύσουν τα δεδομένα του Hadoop. Σκοπός είναι να εκμεταλλευτούμε τα σύνταξη προγραμματισμού και τα πρότυπα κωδικοποίησης της R, ενώ παράλληλα θα διασφαλίσουμε ότι τα δεδομένα θα λειτουργούν όταν παραμείνουν σε HDFS. Τα R datatypes χρησιμεύουν ως πληρεξούσια σε αυτά τα αποθηκευμένα δεδομένα, πράγμα που σημαίνει ότι οι προγραμματιστές R δεν χρειάζεται να σκεφτούν καμπύλες MapReduce χαμηλού επιπέδου ή ειδικές γλώσσες scripting Hadoop (όπως το Pig).

Η τεχνολογία BigInsights Big R υποστηρίζει πολλαπλές πηγές δεδομένων - συμπεριλαμβανομένων των επίπεδων αρχείων, των μορφών αποθήκευσης HBase και Hive - παρέχοντας ταυτόχρονα παράλληλη και χωριστή εκτέλεση του κώδικα R σε ολόκληρο το σύμπλεγμα Hadoop. Κρύβει πολλές από τις πολυπλοκότητες στα υποκείμενα πλαίσια HDFS και MapReduce, επιτρέποντας στις λειτουργίες του Big R να εκτελούν εκτεταμένες αναλύσεις δεδομένων - τόσο σε δομημένα όσο και σε μη δομημένα δεδομένα.

Τέλος, η δυνατότητα επεκτάσεως του στατιστικού μηχανισμού Big R επιτρέπει στους προγραμματιστές R να κάνουν χρήση τόσο των προκαθορισμένων στατιστικών τεχνικών, όσο και των ίδιων των νέων αλγορίθμων.

Hadoop Ενσωμάτωση με R-dummies

Η επιλογή των συντακτών

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Εξαρτήματα ηλεκτρονικών: Ενισχυτές ανοιχτού βρόχου

Οι πιο βασικές ηλεκτρονικές χρήσεις ενός ενισχυτή Op είναι ως ενισχυτής. Εάν συνδέσετε μια πηγή εισόδου σε έναν από τους ακροδέκτες εισόδου και γειώσετε τον άλλο ακροδέκτη εισόδου, εμφανίζεται μια ενισχυμένη έκδοση του σήματος εισόδου στο εξωτερικό τερματικό. Μια σημαντική ιδέα στα κυκλώματα op-amp ...

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Ηλεκτρονικά Στοιχεία: Δημοφιλή Op Amp Ενσωματωμένα Κυκλώματα - Dummy

Για την οικοδόμηση ενός πραγματικού ηλεκτρονικού κυκλώματος χρησιμοποιώντας Op-amp, φυσικά, θα πρέπει να χρησιμοποιήσετε ένα πραγματικό ενισχυτή op. Ευτυχώς, τα ενσωματωμένα ολοκληρωμένα κυκλώματα (IC) είναι άφθονα και σχεδόν όλα τα καταστήματα που πωλούν ηλεκτρονικά εξαρτήματα πωλούν διάφορους τύπους φθηνών IC-ενισχυτών. Το πιο δημοφιλές op-amp IC είναι το LM741, το οποίο έρχεται ...

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

Ηλεκτρονικά Συστατικά: Κύκλοι ταλαντωτών - ανδρείκελοι

. Η ακριβής κυματομορφή που παράγεται εξαρτάται από τον τύπο του κυκλώματος που χρησιμοποιείται για τη δημιουργία του ταλαντωτή. Ένα από τα συνηθέστερα χρησιμοποιούμενα κυκλώματα ταλαντωτών είναι κατασκευασμένο από ένα ζεύγος τρανζίστορ που είναι εφοδιασμένα για να εναλλάσσονται και να σβήνουν εναλλάξ. Αυτός ο τύπος κυκλώματος είναι ...

Η επιλογή των συντακτών

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Ασκήσεις για ανδρείκελα Κατάρτιση για ανδρείκελα Εξάσκηση - ανδρείκελα

Η ασήμαντη εκπαίδευση είναι ένα σημαντικό βήμα στην ανάπτυξη των παιδιών. Ως γονέας, θα πρέπει να αναγνωρίσετε τα σημάδια ότι το παιδί σας είναι έτοιμο για την ομιλία της τουαλέτας, να ξεκινήσει μια διαδικασία ασήμαντης κατάρτισης, να συνεχίσει τη διαδικασία και να αναγνωρίσει πότε το παιδί σας είναι σχεδόν εκεί. Κατά τη διάρκεια της διαδρομής, πρέπει να σιγουρευτείτε ότι το παιδί σας ξέρει ...

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Εκπαίδευση για παιδιά με αναπηρίες - ανδρείκελα

Παιδιά, ανάλογα με την αναπηρία. Μπορεί να χρειαστεί να παρέχετε στηρίγματα υψηλής τεχνολογίας που διευκολύνουν την κίνηση από τον περιπατητή ή την αναπηρική καρέκλα στην τουαλέτα (δείτε την ενότητα "Εργασία με ειδικό εργαλείο" σε αυτό το άρθρο.) Από την άλλη πλευρά, το παιδί σας μπορεί να ...

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Υποδηλώνουν ότι το παιδί σας είναι έτοιμο για ασήμαντη εκπαίδευση - ανδρείκελα

Την ημέρα που κάθε γονιός επιθυμεί, αλλά δεν μπορείτε να βιάσετε τη διαδικασία. Περιμένετε τα σημάδια ότι το παιδί σας είναι έτοιμο να αντιμετωπίσει αυτή τη μεγάλη πρόκληση. Παρακολουθήστε τα σημεία στην παρακάτω λίστα. οι πρώτες πέντε είναι απολύτως απαραίτητες: μένει ξηρό τουλάχιστον δύο ώρες παίρνει Bummed από υγρό ή ...

Η επιλογή των συντακτών

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Πώς να χρησιμοποιήσετε τη φαντασία σας για να χαλαρώσετε το σώμα σας για διαλογισμό - Dummies

Αναδυόμενο πεδίο της ιατρικής μυαλού-σώματος υπενθυμίζει στους ανθρώπους - και γιόγκι και σοφοί έχουν πει για χιλιετίες - το σώμα σας, το μυαλό σας και η καρδιά σας αποτελούν ένα ενιαίο και αδιάσπαστο σύνολο. Όταν οι σκέψεις σας συνεχίζουν να σφύζουν από την ανησυχία σας, το σώμα σας αποκρίνεται με τη σύσφιξη και την τάνυση, ειδικά σε ορισμένες σημαντικές θέσεις ...

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πώς να χρησιμοποιήσετε την προσοχή για τη διαχείριση του πόνου

Πόνος είναι κάτι που θα αντιμετωπίσει κάποιος σε κάποιο σημείο . Η προσοχή μπορεί να σας βοηθήσει να προσεγγίσετε πόνο με υγιεινό τρόπο. Ο οξύς πόνος είναι ένας αιχμηρός πόνος που διαρκεί για μικρό χρονικό διάστημα, μερικές φορές ορίζεται ως λιγότερο από 12 εβδομάδες. Η ιατρική είναι αρκετά καλή για τη θεραπεία του οξέος πόνου. Ο χρόνιος πόνος είναι ο πόνος που διαρκεί ...

Βελτίωση των σχέσεών σας - ανδρείκεS

Βελτίωση των σχέσεών σας - ανδρείκεS

Σχέσεις - είτε με την οικογένεια, τους φίλους ή τους εραστές; Και δεν έχει σημασία πόσο χαρούμενος και ευχαριστημένος είστε με τις σημαντικές σχέσεις στη ζωή σας, υπάρχει πάντα περιθώριο βελτίωσης. Οι σχέσεις, όπως όλες οι διεργασίες, επίσης καταλήγουν και ρέουν και σας παρουσιάζουν προκλήσεις. Εδώ είναι μερικές εξαιρετικές τεχνικές για να σας βοηθήσουμε ...