Βίντεο: Sqoop Import and Export data from RDMBS and HDFS 2024
Η Cloudera είναι ο κορυφαίος πάροχος λογισμικού και υπηρεσιών Apache Hadoop στη μεγάλη αγορά δεδομένων. Όπως το Apache Drill, η τεχνολογία Impala της Cloudera επιδιώκει να βελτιώσει το χρόνο ανταπόκρισης του ερωτήματος για τους χρήστες Hadoop. Το Apache Hive έχει παράσχει έναν οικείο και ισχυρό μηχανισμό αναζήτησης για χρήστες Hadoop, αλλά οι χρόνοι απόκρισης των ερωτήσεων είναι συχνά απαράδεκτοι λόγω της εξάρτησης του Hive από το MapReduce. Η απάντηση της Cloudera σε αυτό το πρόβλημα είναι η Impala.
Η Cloudera έχει αναπτύξει μια μηχανή ερωτήματος MPP, γραμμένη σε C ++, για να αντικαταστήσει το μοτίβο MapReduce με το μοτίβο Apache Hive. Σε αντίθεση με το Dremel και το Drill, η Cloudera αποφάσισε ότι ένας εγγενής μηχανισμός C ++ MPP - αντί για κινητήρα Java - ήταν η απάντηση για γρήγορες, διαλογικές ερωτήσεις Hadoop.
Λάβετε υπόψη σας ότι η Impala χρησιμοποιεί το HiveQL ως διεπαφή προγραμματισμού και οι Engines Query Exec της Impala βρίσκονται σε συνάρτηση με τους κόμβους δεδομένων HDFS, σύμφωνα με την προσέγγιση Hadoop για τον συντοπισμό δεδομένων με τις εργασίες επεξεργασίας. Η Impala μπορεί επίσης να χρησιμοποιήσει το HBase ως κατάστημα δεδομένων. Με αυτή την έννοια, η Impala είναι μια επέκταση του Apache Hadoop, παρέχοντας μια πολύ υψηλής απόδοσης εναλλακτική λύση στο μοντέλο Hive-on-top-of-MapReduce.
Μπορείτε να βρείτε την τεχνολογία Impala της Cloudera, η οποία επίσης εμπνεύστηκε από την εφεύρεση Dremel της Google.