Πίνακας περιεχομένων:
- Η Amazon's Public Elastic Compute Cloud για τα μεγάλα δεδομένα
- Οι μεγάλες υπηρεσίες δεδομένων Google
- Το Microsoft Azure για μεγάλα δεδομένα
- OpenStack για μεγάλα δεδομένα
Βίντεο: Data Analysts Tools - 5 Crucial Data Tools [2019] 2024
Οι προμηθευτές σύννεφων έρχονται σε όλα τα σχήματα και τα μεγέθη και προσφέρουν πολλά διαφορετικά προϊόντα για μεγάλα δεδομένα. Ορισμένα είναι νοικοκυριά, ενώ άλλα εμφανίζονται πρόσφατα. Μερικοί από τους παρόχους cloud που προσφέρουν υπηρεσίες IaaS που μπορούν να χρησιμοποιηθούν για μεγάλα δεδομένα περιλαμβάνουν το Amazon. com, AT & T, GoGrid, Joyent, Rackspace, IBM και Verizon / Terremark.
Η Amazon's Public Elastic Compute Cloud για τα μεγάλα δεδομένα
Σήμερα, ένας από τους πιο σημαντικούς παροχείς υπηρεσιών IaaS είναι η Amazon web Services με το Elastic Compute Cloud (Amazon EC2). Η Amazon δεν ξεκίνησε με ένα όραμα να οικοδομήσει μια μεγάλη επιχείρηση παροχής υπηρεσιών υποδομής.
Αντ 'αυτού, η εταιρεία δημιούργησε μια τεράστια υποδομή για να στηρίξει τη δική της λιανική επιχείρηση και ανακάλυψε ότι οι πόροι της δεν χρησιμοποιήθηκαν επαρκώς. Αντί να επιτρέψει σε αυτό το περιουσιακό στοιχείο να παραμείνει αδρανές, αποφάσισε να αξιοποιήσει αυτόν τον πόρο προσθέτοντας την ουσία. Η υπηρεσία EC2 του Amazon ξεκίνησε το 2006 και συνεχίζει να εξελίσσεται.
Το Amazon EC2 προσφέρει δυνατότητα κλιμάκωσης κάτω από τον έλεγχο του χρήστη, με τον χρήστη να πληρώνει πόρους ανά ώρα. Η χρήση του όρου ελαστικού στην ονομασία του EC2 του Amazon είναι σημαντική. Εδώ, η ελαστικότητα αναφέρεται στην ικανότητα των χρηστών EC2 να αυξήσουν ή να μειώσουν τους πόρους υποδομής που έχουν ανατεθεί για την κάλυψη των αναγκών τους.
Η Amazon προσφέρει επίσης και άλλες μεγάλες υπηρεσίες δεδομένων στους πελάτες του χαρτοφυλακίου υπηρεσιών Amazon web Services. Αυτά περιλαμβάνουν τα εξής:
-
Amazon Elastic MapReduce: Στοχεύει στην επεξεργασία τεράστιων όγκων δεδομένων. Το Elastic MapReduce χρησιμοποιεί ένα φιλοξενούμενο πλαίσιο Hadoop που λειτουργεί με το EC2 και το Amazon Simple Storage Service (Amazon S3). Οι χρήστες μπορούν πλέον να εκτελούν το HBase.
-
Amazon DynamoDB: Μια πλήρως διαχειριζόμενη υπηρεσία βάσεων δεδομένων SQL (NoSQL). Το DynamoDB είναι μια ανεκτική για σφάλματα υπηρεσία, η οποία είναι εξαιρετικά διαθέσιμη, προσφέροντας αυτοπροστατευτική, διαφανή κλιμάκωση και απλή διαχείριση. Εφαρμόζεται σε SSD (δίσκοι στερεάς κατάστασης) για μεγαλύτερη αξιοπιστία και υψηλή απόδοση.
-
Υπηρεσία απλής αποθήκευσης Amazon (S3): Μια υπηρεσία web-scale που έχει σχεδιαστεί για την αποθήκευση οποιουδήποτε όγκου δεδομένων. Η δύναμη του κέντρου σχεδιασμού της είναι η απόδοση και η δυνατότητα κλιμάκωσης, επομένως δεν είναι ως χαρακτηριστικό φορτωμένο με άλλα αποθηκευτικά δεδομένα. Τα δεδομένα αποθηκεύονται σε "κάδους" και μπορείτε να επιλέξετε μία ή περισσότερες παγκόσμιες περιοχές για φυσική αποθήκευση για να αντιμετωπίσετε τις λανθάνουσες ή ρυθμιστικές ανάγκες.
-
Υπολογισμός υψηλής απόδοσης Amazon: Συντονισμένο για εξειδικευμένες εργασίες, η υπηρεσία αυτή παρέχει σύνθετα clusters υψηλής απόδοσης με υψηλή καθυστέρηση. Πιο συχνά χρησιμοποιείται από επιστήμονες και ακαδημαϊκούς, η HPC εισέρχεται στο mainstream λόγω της προσφοράς του Amazon και άλλων παρόχων HPC.Τα clusters HPC της Amazon είναι σχεδιασμένα για συγκεκριμένους φόρτους εργασίας και μπορούν εύκολα να διαμορφωθούν εύκολα για νέες εργασίες.
-
Amazon RedShift: Διαθέσιμο σε περιορισμένη προεπισκόπηση, το RedShift είναι μια υπηρεσία αποθήκευσης δεδομένων με πεταχωβάτη που βασίζεται σε μια κλιμακούμενη αρχιτεκτονική MPP. Υπεύθυνη για την διαχείριση του Amazon, προσφέρει μια ασφαλή, αξιόπιστη εναλλακτική λύση στις εσωτερικές αποθήκες δεδομένων και είναι συμβατή με πολλά δημοφιλή εργαλεία επιχειρηματικής ευφυΐας.
Οι μεγάλες υπηρεσίες δεδομένων Google
Η Google, ο γίγαντας της αναζήτησης στο Διαδίκτυο, προσφέρει επίσης πολλές υπηρεσίες cloud για μεγάλα δεδομένα. Αυτά περιλαμβάνουν τα ακόλουθα:
-
Google Compute Engine: Μια τεχνολογία που βασίζεται σε σύννεφο για υπολογιστές εικονικών υπολογιστών, το Google Compute Engine προσφέρει ένα ασφαλές, ευέλικτο περιβάλλον πληροφορικής από κέντρα δεδομένων με υψηλή ενεργειακή απόδοση. Η Google προσφέρει επίσης λύσεις διαχείρισης φόρτου εργασίας από διάφορους συνεργάτες τεχνολογίας που έχουν βελτιστοποιήσει τα προϊόντα τους για το Google Compute Engine.
-
Μεγάλο ερώτημα Google: Σας επιτρέπει να εκτελείτε ερωτήματα που μοιάζουν με SQL με μεγάλη ταχύτητα σε σχέση με μεγάλα σύνολα δεδομένων πιθανών δισεκατομμυρίων σειρών. Παρόλο που είναι καλό για την ερώτηση δεδομένων, τα δεδομένα δεν μπορούν να τροποποιηθούν αφού είναι σε αυτό. Εξετάστε το Big Query του Google ένα είδος συστήματος online αναλυτικής επεξεργασίας (OLAP) για μεγάλα δεδομένα. Είναι καλό για ad hoc αναφορά ή διερευνητική ανάλυση.
-
API Πρόβλεψης Google: Ένα εργαλείο εκμάθησης μηχανών που βασίζεται σε σύννεφο για τεράστια ποσά δεδομένων, η Πρόβλεψη είναι ικανή να αναγνωρίζει τα μοτίβα στα δεδομένα και στη συνέχεια να τα θυμάται. Μπορεί να μάθει περισσότερα για ένα μοτίβο κάθε φορά που χρησιμοποιείται. Τα πρότυπα μπορούν να αναλυθούν για διάφορους σκοπούς, συμπεριλαμβανομένης της ανίχνευσης της απάτης, της ανάλυσης του churn και του συναισθήματος των πελατών.
Το Microsoft Azure για μεγάλα δεδομένα
Με βάση τα Windows και SQL abstractions, η Microsoft έχει δημιουργήσει ένα σύνολο εργαλείων ανάπτυξης, υποστήριξης εικονικών μηχανών, διαχείρισης και υπηρεσιών πολυμέσων και υπηρεσιών κινητής συσκευής σε μια προσφορά PaaS. Για τους πελάτες με μεγάλη τεχνογνωσία στο Net, SQLServer και Windows, η υιοθέτηση του PaaS βασισμένου σε Azure είναι απλή.
Για την αντιμετώπιση των αναδυόμενων απαιτήσεων για την ενσωμάτωση μεγάλων δεδομένων στις λύσεις Windows Azure, η Microsoft έχει επίσης προσθέσει το Windows Azure HDInsight. Η πλατφόρμα δεδομένων Hortonworks Data Platform (HDP), η οποία σύμφωνα με τη Microsoft προσφέρει 100% συμβατότητα με τον Apache Hadoop, υποστηρίζει τη σύνδεση HDInsight με το Microsoft Excel και άλλα εργαλεία επιχειρηματικής ευφυΐας (BI). Εκτός από το Azure HDInsight μπορεί επίσης να αναπτυχθεί στον Windows Server.
OpenStack για μεγάλα δεδομένα
Το OpenStack, με πρωτοβουλία του Rackspace και της NASA, υλοποιεί μια πλατφόρμα ανοιχτού σύννεφου με στόχο είτε δημόσια είτε ιδιωτικά νέφη. Ενώ ο οργανισμός διοικείται στενά από το Rackspace, μεταφέρθηκε σε ξεχωριστό ίδρυμα OpenStack. Παρόλο που οι εταιρείες μπορούν να εκμεταλλευτούν το OpenStack για να δημιουργήσουν ιδιόκτητες υλοποιήσεις, ο χαρακτηρισμός OpenStack απαιτεί συμμόρφωση με μια τυπική υλοποίηση των υπηρεσιών.
Ο στόχος του OpenStack είναι να παρέχει μια μαζικά κλιμακωτή, πολυετή προδιαγραφή cloud που μπορεί να τρέχει σε οποιοδήποτε υλικό. Το OpenStack οικοδομεί ένα μεγάλο οικοσύστημα εταίρων που ενδιαφέρονται να υιοθετήσουν την πλατφόρμα του cloud, συμπεριλαμβανομένων των Dell, HP, Intel, Cisco, Red Hat και IBM, μαζί με τουλάχιστον άλλα 100 που χρησιμοποιούν το OpenStack ως βάση για τις προσφορές σύννεφων τους.
Στην ουσία, το OpenStack είναι μια πρωτοβουλία open source IaaS που βασίζεται στο Ubuntu, ένα λειτουργικό σύστημα βασισμένο στη διανομή του Debian Linux. Μπορεί επίσης να τρέξει σε έκδοση του Red Hat του Linux.
Το OpenStack προσφέρει μια σειρά από υπηρεσίες, όπως υπολογιστικά, αποθήκευση αντικειμένων, καταλόγους και αποθετήρια, ταμπλό, ταυτότητα και δικτύωση. Από την άποψη των μεγάλων δεδομένων, η Rackspace και η Hortonworks (προμηθευτής πλατφόρμας διαχείρισης ανοιχτού κώδικα βασισμένης στον Apache Hadoop) ανακοίνωσαν ότι η Rackspace θα κυκλοφορήσει μια δημόσια υπηρεσία cloud-based OpenStack Hadoop, η οποία θα επικυρωθεί και θα υποστηριχθεί από την Hortonworks για να δημιουργήσετε γρήγορα ένα μεγάλο περιβάλλον δεδομένων.