Πίνακας περιεχομένων:
Βίντεο: Καταχώρηση δεδομένων στο excel με φόρμα 2024
Υπάρχουν δύο είδη βάσεων δεδομένων εγγράφων για μεγάλα έργα δεδομένων. Το ένα περιγράφεται συχνά ως αποθήκη για πλήρες περιεχόμενο σε μορφή εγγράφου. Η άλλη είναι μια βάση δεδομένων για την αποθήκευση στοιχείων εγγράφων για μόνιμη αποθήκευση ως στατική οντότητα ή για δυναμική συναρμολόγηση των τμημάτων ενός εγγράφου. Η δομή των εγγράφων και των τμημάτων τους παρέχεται από το JavaScript Object Notation (JSON) ή / και το Binary JSON (BSON).
Οι βάσεις δεδομένων εγγράφων είναι πολύ χρήσιμες όταν πρέπει να παράγετε πολλές αναφορές και πρέπει να συναρμολογούνται δυναμικά από στοιχεία που αλλάζουν συχνά.
Στην καρδιά του, το JSON είναι μια μορφή ανταλλαγής δεδομένων, βασισμένη σε ένα υποσύνολο της γλώσσας προγραμματισμού JavaScript. Παρόλο που αποτελεί μέρος μιας γλώσσας προγραμματισμού, είναι κειμένου και είναι πολύ εύκολο να διαβαστεί και να γραφτεί. Έχει επίσης το πλεονέκτημα ότι είναι εύκολο να χειριστούν οι υπολογιστές. Δύο βασικές δομές υπάρχουν στο JSON και υποστηρίζονται από πολλές, αν όχι όλες, σύγχρονες γλώσσες προγραμματισμού.
Η πρώτη βασική δομή είναι μια συλλογή ζευγών ονόματος / τιμής και αντιπροσωπεύονται προγραμματικά ως αντικείμενα, αρχεία, λίστες με κλειδιά και ούτω καθεξής. Η δεύτερη βασική δομή είναι ένας ταξινομημένος κατάλογος τιμών και παρουσιάζονται προγραμματικά ως πίνακες, λίστες ή ακολουθίες. Το BSON είναι μια δυαδική σειριοποίηση δομών JSON που έχει σχεδιαστεί για να αυξάνει την απόδοση και την επεκτασιμότητα.
MongoDB για μεγάλα δεδομένα
Το MongoDB είναι το όνομα του έργου για το σύστημα "hu (mongo) us database". Διατηρείται από μια εταιρεία που ονομάζεται 10gen ως ανοιχτή πηγή και είναι ελεύθερα διαθέσιμη υπό το GNU AGPL v3. 0 άδεια. Εμπορικές άδειες με πλήρη υποστήριξη διατίθενται από το 10gen.
Το MongoDB αποτελείται από βάσεις δεδομένων που περιέχουν "συλλογές". "Μια συλλογή αποτελείται από" έγγραφα ", και κάθε έγγραφο αποτελείται από πεδία. Όπως και στις σχεσιακές βάσεις δεδομένων, μπορείτε να καταχωρίσετε μια συλλογή.
Με αυτόν τον τρόπο αυξάνεται η απόδοση αναζήτησης δεδομένων. Σε αντίθεση με άλλες βάσεις δεδομένων, ωστόσο, το MongoDB επιστρέφει κάτι που ονομάζεται "δρομέας", το οποίο χρησιμεύει ως δείκτης στα δεδομένα. Αυτή είναι μια πολύ χρήσιμη δυνατότητα επειδή προσφέρει την επιλογή της καταμέτρησης ή ταξινόμησης των δεδομένων χωρίς εξαγωγή. Στην πραγματικότητα, το MongoDB υποστηρίζει την BSON, τη δυαδική υλοποίηση των εγγράφων JSON.
Το MongoDB είναι επίσης ένα οικοσύστημα που αποτελείται από τα ακόλουθα στοιχεία:
-
Υπηρεσίες υψηλής διαθεσιμότητας και αναπαραγωγής για κλιμάκωση σε τοπικά και ευρείας περιοχής δίκτυα.
-
Ένα σύστημα αρχείων με βάση το δίκτυο, το οποίο επιτρέπει την αποθήκευση μεγάλων αντικειμένων διαιρώντας τα μεταξύ πολλών εγγράφων.
-
MapReduce για την υποστήριξη της ανάλυσης και της συνάθροισης διαφόρων συλλογών / εγγράφων.
-
Μια υπηρεσία θραύσης που διανέμει μια ενιαία βάση δεδομένων σε ένα σύμπλεγμα διακομιστών σε ένα ή σε πολλά κέντρα δεδομένων. Η υπηρεσία οδηγείται από ένα κλειδί σκίουρου. Το κλειδί shard χρησιμοποιείται για την έξυπνη διανομή εγγράφων σε πολλαπλές περιπτώσεις.
-
Μια υπηρεσία αναζήτησης που υποστηρίζει επερωτήσεις ad hoc, κατανεμημένα ερωτήματα και αναζήτηση πλήρους κειμένου.
Οι αποτελεσματικές υλοποιήσεις του MongoDB περιλαμβάνουν
-
Διαχείριση μεγάλου όγκου περιεχομένου
-
Κοινωνική δικτύωση
-
Αρχειοθέτηση
-
Αναλυτικά σε πραγματικό χρόνο
CouchDB για μεγάλα δεδομένα
Μια πολύ δημοφιλής μη σχετική βάση δεδομένων είναι η CouchDB. Όπως το MongoDB, το CouchDB είναι ανοικτού κώδικα. Διατηρείται από το Apache Software Foundation και διατίθεται με το Apache License v2. 0. Σε αντίθεση με το MongoDB, το CouchDB σχεδιάστηκε για να μιμείται τον ιστό από κάθε άποψη.
Για παράδειγμα, το CouchDB είναι ανθεκτικό στις εγκατάλειψη του δικτύου και θα συνεχίσει να λειτουργεί όμορφα σε περιοχές όπου η συνδεσιμότητα δικτύου είναι ασταθής. Είναι επίσης στο σπίτι σε ένα smartphone ή σε ένα κέντρο δεδομένων. Όλα αυτά έρχονται με μερικά συμβιβασμούς. Λόγω της υποκείμενης μιμητοποίησης ιστού, το CouchDB είναι υψηλή λανθάνουσα κατάσταση που έχει ως αποτέλεσμα την προτίμηση για τοπική αποθήκευση δεδομένων.
Το CouchDB δεν είναι κατάλληλο για μικρότερες εφαρμογές. Πρέπει να προσδιορίσετε εάν αυτές οι αντισταθμίσεις μπορούν να αγνοηθούν κατά την έναρξη της μεγάλης εφαρμογής των δεδομένων σας.
Οι βάσεις δεδομένων CouchDB αποτελούνται από έγγραφα που αποτελούνται από πεδία και συνημμένα, καθώς και από μια "περιγραφή" του εγγράφου με τη μορφή μεταδεδομένων που τηρούνται αυτόματα από το σύστημα. Η υποκείμενη τεχνολογία διαθέτει όλες τις δυνατότητες ACID. Το πλεονέκτημα του CouchDB έναντι του σχεσιακού είναι ότι τα δεδομένα είναι συσκευασμένα και έτοιμα για χειρισμό ή αποθήκευση αντί να διασκορπιστούν σε σειρές και πίνακες.
Το CouchDB είναι επίσης ένα οικοσύστημα με τις ακόλουθες δυνατότητες:
-
Συμπίεση: Οι βάσεις δεδομένων είναι συμπιεσμένες για να εξαλείψουν το σπατάλη του χώρου όταν επιτευχθεί ένα ορισμένο επίπεδο κενού. Αυτό βοηθά την απόδοση και την αποδοτικότητα για επιμονή.
-
Μοντέλο προβολής: Ένας μηχανισμός για φιλτράρισμα, οργάνωση και αναφορά δεδομένων χρησιμοποιώντας ένα σύνολο ορισμών που αποθηκεύονται ως έγγραφα στη βάση δεδομένων. Βρίσκετε μία σχέση πολλαπλών βάσεων δεδομένων με προβολές, έτσι ώστε να μπορείτε να δημιουργήσετε πολλούς διαφορετικούς τρόπους αντιπροσώπευσης των δεδομένων που έχετε "κομμένα σε φέτες και σε κύβους. "
-
Υπηρεσίες αναπαραγωγής και διανομής: Η αποθήκευση εγγράφων έχει σχεδιαστεί για να παρέχει αμφίδρομη αναπαραγωγή. Μερικά αντίγραφα μπορούν να διατηρηθούν για να υποστηρίξουν τη διανομή με βάση κριτήρια ή τη μετάβαση σε συσκευές με περιορισμένη συνδεσιμότητα. Η εγγενής αναπαραγωγή βασίζεται σε ομότιμους χρήστες, αλλά μπορείτε να εφαρμόσετε το Master / Slave, Master / Master και άλλους τύπους αντιγραφής.
Οι αποτελεσματικές εφαρμογές CouchDB περιλαμβάνουν
-
Διαχείριση μεγάλου όγκου περιεχομένου
-
Κλιμάκωση από smartphone σε κέντρο δεδομένων
-
Εφαρμογές με περιορισμένη ή αργή συνδεσιμότητα δικτύου