Βίντεο: DOCUMENTARY: Edward Snowden - Terminal F (2015) 2025
Ο πρώτος πελάτης Hive είναι η διεπαφή γραμμής εντολών Hive (CLI). Για να ελέγξετε τα καλύτερα σημεία του προγράμματος-πελάτη Hive CLI, θα μπορούσε να βοηθήσει στην ανασκόπηση της αρχιτεκτονικής κυψέλης (κάπως απασχολημένος).
Στο δεύτερο σχήμα, η αρχιτεκτονική είναι εξορθολογισμένη για να εστιάσει μόνο στα στοιχεία που απαιτούνται κατά την εκτέλεση του CLI.
Αυτές είναι οι συνιστώσες της κυψέλης που χρειάζονται όταν τρέχετε το CLI σε ένα σύμπλεγμα Hadoop. Εδώ, εκτελείτε την κυψέλη σε τοπική λειτουργία, η οποία χρησιμοποιεί δεδομένα τοπικής αποθήκευσης αντί για HDFS.
Για να εκτελέσετε το CLI Hive, εκτελείτε την εντολή Hive και καθορίζετε το CLI ως την υπηρεσία που θέλετε να εκτελέσετε. Στην παρακάτω λίστα, μπορείτε να δείτε την εντολή που απαιτείται καθώς και μερικές από τις πρώτες μας δηλώσεις HiveQL. (Η απαρίθμηση βημάτων χρησιμοποιώντας το μοντέλο A-B-C περιλαμβάνεται στην καταχώριση για να κατευθύνει την προσοχή σας στις εντολές των πλήκτρων.)
(Α) $ HIVE_HOME / bin hive - service cli (Β) κυψέλη> ομάδα κυψελών. cli. Τυπώνω. ρεύμα. db = true; (C) κυψέλη (προεπιλογή)> CREATE DATABASE ourfirstdatabase; OK Ώρα που ελήφθη: 3.756 δευτερόλεπτα (D) κυψέλη (προεπιλογή)> ΧΡΗΣΙΜΟΠΟΙΗΣΤΕ την αρχική μας βάση δεδομένων. OK Ώρα που ελήφθη: 0. 039 δευτερόλεπτα (E) κυψέλη (ourfirstdatabase)> CREATE TABLE our_first_table (> Όνομα ΑΡΧΗ, STRING,> EmployeeId INT); OK Χρόνος που ελήφθη: 0. 043 δευτερόλεπτα κυψέλη (ourfirstdatabase)> quit; (F) $ ls / home / biadmin / κυψέλη / αποθήκη / αρχική βάση δεδομένων. db our_first_tableΗ πρώτη εντολή (βλ. Βήμα A) ξεκινάει το CLI του Hive χρησιμοποιώντας τη μεταβλητή περιβάλλοντος $ HIVE_HOME. Η επιλογή γραμμής εντολών - service cli κατευθύνει το σύστημα Hive για να ξεκινήσει τη διεπαφή γραμμής εντολών, αν και θα μπορούσατε να έχετε επιλέξει άλλους διακομιστές.
Στη συνέχεια, στο Βήμα Β, πείτε στο CLI του Hive να εκτυπώσει την τρέχουσα βάση δεδομένων εργασίας σας έτσι ώστε να γνωρίζετε πού βρίσκεστε στο χώρο ονομάτων. (Αυτή η δήλωση θα έχει νόημα αφού θα εξηγήσουμε πώς να χρησιμοποιήσουμε την επόμενη εντολή, οπότε κρατάτε σφιχτά.)
Στο Βήμα C χρησιμοποιείτε τη γλώσσα ορισμού δεδομένων HiveQL (DDL) για να δημιουργήσετε την πρώτη σας βάση δεδομένων. (Να θυμάστε ότι οι βάσεις δεδομένων στην κυψέλη είναι απλά οι χώροι ονομάτων όπου βρίσκονται ορισμένοι πίνακες, επειδή ένα σύνολο πινάκων μπορεί να θεωρηθεί ως βάση δεδομένων ή σχήμα, θα μπορούσατε να χρησιμοποιήσετε τον όρο SCHEMA αντί της DATABASE για να πετύχετε το ίδιο αποτέλεσμα.).
Συγκεκριμένα, χρησιμοποιείτε το DDL για να πείτε στο σύστημα να δημιουργήσει μια βάση δεδομένων που ονομάζεται ourfirstdatabase και στη συνέχεια να κάνει αυτήν την βάση δεδομένων την προεπιλογή για τις επόμενες εντολές HiveQL DDL χρησιμοποιώντας την εντολή USE στο Βήμα D. Στο Βήμα Ε, και δώστε το (αρκετά κατάλληλο) όνομα our_first_table.
(Μέχρι τώρα, μπορεί να έχετε πιστέψει ότι μοιάζει πολύ με το SQL, ίσως με μερικές ήσσονος σημασίας διαφορές στη σύνταξη ανάλογα με το RDBMS που έχετε συνηθίσει - και θα είχατε δίκιο.) Η τελευταία εντολή, Βήμα F, πραγματοποιεί μια λίστα με καταλόγους του καταλόγου αποθηκευμένων χώρων αποθήκευσης που έχετε επιλέξει ώστε να μπορείτε να δείτε ότι το our_first_table έχει πράγματι αποθηκευτεί στο δίσκο.
Ορίσατε την ομάδα. metastore. αποθήκη. dir για να μεταβείτε στον τοπικό κατάλογο / home / biadmin / Hive / αποθήκη στην εικονική μηχανή του Linux, αντί να χρησιμοποιήσετε το HDFS όπως θα κάνατε σε ένα σωστό σύμπλεγμα Hadoop.
Αφού δημιουργήσετε ένα τραπέζι, είναι ενδιαφέρον να δείτε τα μεταδεδομένα του πίνακα. Σε περιβάλλοντα παραγωγής, μπορεί να έχετε δεκάδες τραπέζια ή περισσότερα, οπότε είναι χρήσιμο να μπορείτε να ελέγχετε κατά καιρούς τη δομή του πίνακα. Εσείς c και χρησιμοποιήστε μια εντολή HiveQL για να το κάνετε αυτό χρησιμοποιώντας το Hive CLI, αλλά ο διακομιστής HWI (Hive Web Interface) παρέχει μια χρήσιμη διεπαφή για αυτόν τον τύπο λειτουργίας.
Η χρήση του διακομιστή HWI αντί του CLI μπορεί επίσης να είναι πιο ασφαλής. Πρέπει να δίνεται προσοχή κατά τη χρήση του CLI σε περιβάλλοντα παραγωγής, επειδή το μηχάνημα που λειτουργεί με CLI πρέπει να έχει πρόσβαση σε ολόκληρο το σύμπλεγμα Hadoop.
Επομένως, οι διαχειριστές συστημάτων συνήθως χρησιμοποιούν εργαλεία όπως το ασφαλές κέλυφος (ssh) προκειμένου να παρέχουν ελεγχόμενη και ασφαλή πρόσβαση στο μηχάνημα που εκτελεί το CLI καθώς και να παρέχουν κρυπτογράφηση δικτύου. Ωστόσο, όταν χρησιμοποιείται ο διακομιστής HWI, ο χρήστης μπορεί να έχει πρόσβαση μόνο στα δεδομένα κυψελών που επιτρέπονται από τον διακομιστή HWI μέσω του προγράμματος περιήγησης ιστού του.
