Βίντεο: Τα νέα δεδομένα μας | ΜΙΧΑΛΗΣ ΒΑΦΟΠΟΥΛΟΣ | TEDxVeria 2024
Μια πρωταρχική σκέψη κατά την πραγματοποίηση ενός μεγάλου έργου δεδομένων είναι το προβλεπόμενο ποσό πραγματικού και μη πραγματικού χρόνου που απαιτείται για την υλοποίηση της πρωτοβουλίας σας. Τα μεγάλα δεδομένα συχνά αφορούν πράγματα που δεν ήταν εφικτά επειδή η τεχνολογία δεν ήταν αρκετά προηγμένη ή το κόστος ήταν απαγορευτικό. Η μεγάλη αλλαγή που συμβαίνει με τα μεγάλα δεδομένα είναι η δυνατότητα μόχλευσης μεγάλων ποσοτήτων δεδομένων χωρίς τον περίπλοκο προγραμματισμό που απαιτείται στο παρελθόν.
Πολλοί οργανισμοί βρίσκονται σε σημείο ανατροπής όσον αφορά τη διαχείριση μεγάλων όγκων σύνθετων δεδομένων. Μεγάλες προσεγγίσεις δεδομένων θα βοηθήσουν να διατηρηθούν τα πράγματα σε ισορροπία, ώστε οι επιχειρήσεις να μην ξεπερνούν τον όγκο καθώς ο όγκος, η ποικιλία και η ταχύτητα των αλλαγών των δεδομένων. Οι εταιρείες αντιμετώπισαν δυσκολίες στη διαχείριση αυξανόμενων ποσοτήτων δεδομένων που πρέπει να διαχειρίζονται με υψηλές ταχύτητες.
Οι οργανισμοί αναγκάστηκαν να αναλύσουν μικρά υποσύνολα δεδομένων, τα οποία συχνά δεν είχαν κρίσιμες πληροφορίες για να αποκτήσουν πλήρη εικόνα που θα μπορούσαν να αποκαλύψουν τα δεδομένα. Καθώς οι μεγάλες τεχνολογίες δεδομένων εξελίσσονται και αναπτύσσονται, οι εταιρείες θα μπορούν να αναλύουν ευκολότερα τα δεδομένα και να τα χρησιμοποιούν για να λαμβάνουν αποφάσεις ή να λαμβάνουν μέτρα.
Οι πραγματικές πτυχές των μεγάλων δεδομένων μπορούν να είναι επαναστατικές όταν οι επιχειρήσεις πρέπει να λύσουν σημαντικά προβλήματα. Ποιος είναι ο αντίκτυπος όταν ένας οργανισμός μπορεί να χειριστεί δεδομένα που ρέουν σε πραγματικό χρόνο; Γενικά, αυτή η προσέγγιση σε πραγματικό χρόνο είναι πιο σημαντική όταν η απάντηση σε ένα πρόβλημα είναι ευαίσθητη στο χρόνο και κρίσιμη για τις επιχειρήσεις. Αυτό μπορεί να σχετίζεται με μια απειλή για κάτι σημαντικό, όπως ανίχνευση της απόδοσης του νοσοκομειακού εξοπλισμού ή πρόβλεψη ενός πιθανού κινδύνου εισβολής.
Παρακολούθηση μιας εξαίρεσης με μια νέα πληροφορία, όπως η απάτη / η νοημοσύνη-
Παρακολούθηση των ροών ειδήσεων και των κοινωνικών μέσων ενημέρωσης για τον προσδιορισμό συμβάντων που ενδέχεται να επηρεάσουν τις χρηματοπιστωτικές αγορές, όπως η αντίδραση των πελατών σε μια νέα ανακοίνωση προϊόντος
-
Αλλαγή της τοποθέτησης της διαφήμισής σας κατά τη διάρκεια ενός μεγάλου αθλητικού γεγονότος που βασίζεται σε ροές Twitter σε πραγματικό χρόνο
-
Παροχή ενός κουπονιού σε έναν πελάτη με βάση αυτό που αγόρασε στο σημείο πώλησης
-
Μερικές φορές τα δεδομένα ροής έρχονται πραγματικά γρήγορα και δεν περιλαμβάνουν μεγάλη ποικιλία πηγών, μερικές φορές υπάρχει μεγάλη ποικιλία και μερικές φορές είναι ένας συνδυασμός τα δύο.
Το ερώτημα που πρέπει να αναρωτηθείτε εάν μετακομίζετε σε πραγματικό χρόνο είναι αυτό: Μπορεί αυτό το πρόβλημα να επιλυθεί με τις παραδοσιακές δυνατότητες διαχείρισης πληροφοριών ή χρειάζεστε νεότερες δυνατότητες;Είναι ο τεράστιος όγκος ή η ταχύτητα να κατακλύσουν τα συστήματά μας; Πολλές φορές είναι ένας συνδυασμός των δύο.
Επομένως, εάν χρειάζεστε δυνατότητες σε πραγματικό χρόνο, ποιες είναι οι απαιτήσεις της υποδομής για να το υποστηρίξετε αυτό; Η παρακάτω λίστα αναδεικνύει μερικά πράγματα που πρέπει να εξετάσετε σχετικά με την ικανότητα του συστήματος να καταπιεί δεδομένα, να τα επεξεργάζεται και να τα αναλύει σε πραγματικό χρόνο:
Χαμηλή καθυστέρηση:
-
Η καθυστέρηση είναι η χρονική υστέρηση που επιτρέπει σε μια υπηρεσία εκτέλεση σε περιβάλλον. Ορισμένες εφαρμογές απαιτούν λιγότερη καθυστέρηση, πράγμα που σημαίνει ότι πρέπει να ανταποκρίνονται σε πραγματικό χρόνο. Ένα ρεύμα σε πραγματικό χρόνο θα απαιτήσει χαμηλή λανθάνουσα κατάσταση. Έτσι, πρέπει να σκεφτείτε τον υπολογισμό της εξουσίας καθώς και τους περιορισμούς του δικτύου. Επεκτασιμότητα:
-
Η δυνατότητα κλιμάκωσης είναι η δυνατότητα να διατηρηθεί ένα ορισμένο επίπεδο απόδοσης ακόμη και υπό αυξημένα φορτία. Ευελιξία:
-
Το σύστημα πρέπει να υποστηρίζει τόσο δομημένες όσο και μη δομημένες ροές δεδομένων. Φυσική μορφή:
-
Χρησιμοποιήστε τα δεδομένα στη μητρική τους μορφή. Ο μετασχηματισμός απαιτεί χρόνο και χρήμα. Η δυνατότητα χρήσης της ιδέας επεξεργασίας πολύπλοκων αλληλεπιδράσεων στα δεδομένα που ενεργοποιούν τα γεγονότα μπορεί να είναι μετασχηματιστική. Η ανάγκη επεξεργασίας συνεχώς αυξανόμενων ποσοτήτων ανόμοιων δεδομένων είναι ένας από τους βασικούς παράγοντες που οδηγούν στην υιοθέτηση υπηρεσιών cloud. Το μοντέλο σύννεφο είναι μεγάλης κλίμακας και διανέμεται.