Βίντεο: Μ. Παραγιουδάκης : Ισχυρή Αποτροπή, τέλος με τον κατευνασμό 2024
Για να κατανοήσετε τις ροές εργασίας μεγάλων δεδομένων, πρέπει να καταλάβετε τι είναι μια διαδικασία και πώς σχετίζεται με τη ροή εργασίας σε περιβάλλοντα με ένταση δεδομένων. Οι διαδικασίες τείνουν να σχεδιάζονται ως δομές υψηλού επιπέδου, από άκρο σε άκρο, χρήσιμες για τη λήψη αποφάσεων και ομαλοποίηση του τρόπου με τον οποίο γίνονται τα πράγματα σε μια εταιρεία ή οργανισμό.
Αντίθετα, οι ροές εργασίας είναι προσανατολισμένες στις εργασίες και απαιτούν συχνά πιο συγκεκριμένα δεδομένα από τις διαδικασίες. Οι διαδικασίες αποτελούνται από μία ή περισσότερες ροές εργασίας που σχετίζονται με τον γενικό στόχο της διαδικασίας.
Με πολλούς τρόπους, οι μεγάλες ροές δεδομένων δεδομένων είναι παρόμοιες με τις συνήθεις ροές εργασίας. Στην πραγματικότητα, σε οποιαδήποτε ροή εργασίας, είναι απαραίτητα δεδομένα στις διάφορες φάσεις για την εκτέλεση των εργασιών. Εξετάστε τη ροή εργασίας σε μια κατάσταση υγείας.
Μια στοιχειώδης ροή εργασίας είναι η διαδικασία "έλξης αίματος. "Το σχέδιο αίματος είναι απαραίτητο έργο που απαιτείται για να ολοκληρωθεί η συνολική διαδικασία διάγνωσης. Αν συμβεί κάτι και δεν έχει τραβηχτεί αίμα ή έχουν χαθεί τα δεδομένα από αυτό το τεστ αίματος, αυτό θα έχει άμεσο αντίκτυπο στην ειλικρίνεια ή την ειλικρίνεια της συνολικής δραστηριότητας.
Τι συμβαίνει όταν εισάγετε μια ροή εργασίας που εξαρτάται από μια μεγάλη πηγή δεδομένων; Αν και ίσως μπορείτε να χρησιμοποιήσετε τις υπάρχουσες ροές εργασίας, δεν μπορείτε να υποθέσετε ότι μια διαδικασία ή μια ροή εργασίας θα λειτουργήσει σωστά αντικαθιστώντας απλά μια μεγάλη πηγή δεδομένων για μια τυπική πηγή. Αυτό μπορεί να μην λειτουργήσει επειδή οι τυποποιημένες μέθοδοι επεξεργασίας δεδομένων δεν έχουν τις προσεγγίσεις επεξεργασίας ή την απόδοση για να χειριστούν την πολυπλοκότητα των μεγάλων δεδομένων.
Το παράδειγμα της υγειονομικής περίθαλψης επικεντρώνεται στην ανάγκη διεξαγωγής ανάλυσης μετά τη λήψη του αίματος από τον ασθενή. Στην τυπική ροή δεδομένων δεδομένων, το αίμα πληκτρολογείται και στη συνέχεια εκτελούνται ορισμένες χημικές δοκιμές βάσει των απαιτήσεων του ιατρού.
Είναι απίθανο ότι αυτή η ροή εργασίας κατανοεί τις δοκιμές που απαιτούνται για την αναγνώριση συγκεκριμένων βιοδεικτών ή γενετικών μεταλλάξεων. Εάν παρέχετε μεγάλες πηγές δεδομένων για βιοδείκτες και μεταλλάξεις, η ροή εργασίας θα αποτύχει. Δεν είναι γνωστά τα μεγάλα δεδομένα και θα πρέπει να τροποποιηθούν ή να ξαναγραφούν για την υποστήριξη μεγάλων δεδομένων.
Η καλύτερη πρακτική για την κατανόηση των ροών εργασίας και το αποτέλεσμα των μεγάλων δεδομένων είναι να κάνετε τα εξής:
-
Προσδιορίστε τις μεγάλες πηγές δεδομένων που πρέπει να χρησιμοποιήσετε.
-
Χαρτογραφήστε τους μεγάλους τύπους δεδομένων στους τύπους δεδομένων ροής εργασίας.
-
Βεβαιωθείτε ότι έχετε την ταχύτητα επεξεργασίας και την πρόσβαση αποθήκευσης για να υποστηρίξετε τη ροή εργασίας σας.
-
Επιλέξτε το αποθηκευτικό χώρο δεδομένων που ταιριάζει καλύτερα στους τύπους δεδομένων.
-
Τροποποιήστε την υπάρχουσα ροή εργασίας για να φιλοξενήσετε μεγάλα δεδομένα ή να δημιουργήσετε νέα ροή εργασίας μεγάλων δεδομένων.
Αφού έχετε τις μεγάλες ροές δεδομένων σας, θα χρειαστεί να τις προσαρμόσετε ώστε να μην κατακλύσουν ή να μολύνουν την ανάλυσή σας.Για παράδειγμα, πολλές μεγάλες πηγές δεδομένων δεν περιλαμβάνουν σαφώς ορισμένους ορισμούς δεδομένων και μεταδεδομένα σχετικά με τα στοιχεία αυτών των πηγών. Μερικές φορές αυτές οι πηγές δεδομένων δεν έχουν καθαριστεί. Πρέπει να βεβαιωθείτε ότι έχετε το σωστό επίπεδο γνώσης σχετικά με τις πηγές που πρόκειται να χρησιμοποιήσετε.