Πίνακας περιεχομένων:
- Δεδομένα χρήσιμα στην επιστήμη των δεδομένων
- Τεχνολογίες και δεξιότητες χρήσιμα στην επιστήμη των δεδομένων
Βίντεο: Web Programming - Computer Science for Business Leaders 2016 2024
Στο πλαίσιο της επιχείρησης, η επιστήμη των δεδομένων εξυπηρετεί τον ίδιο σκοπό που κάνει η επιχειρησιακή ευφυΐα - τα ακατέργαστα δεδομένα σε επιχειρηματικές γνώσεις που μπορούν να χρησιμοποιήσουν οι ηγέτες των επιχειρήσεων και οι διαχειριστές για να λαμβάνουν αποφάσεις βάσει στοιχείων.
Αν έχετε μεγάλα σύνολα δομημένων και αδόμητων πηγών δεδομένων που μπορεί να είναι ή να μην είναι πλήρεις και θέλετε να μετατρέψετε αυτές τις πηγές σε πολύτιμες πληροφορίες για υποστήριξη αποφάσεων σε όλη την επιχείρηση, καλέστε έναν επιστήμονα δεδομένων. Η επιστήμη δεδομένων βασισμένη στις επιχειρήσεις είναι διεπιστημονική και ενσωματώνει τα εξής στοιχεία:
-
Ποσοτική ανάλυση: Μπορεί να έχει τη μορφή μαθηματικής μοντελοποίησης, πολυμεταβλητής στατιστικής ανάλυσης, πρόβλεψης και / ή προσομοιώσεων.
Ο όρος multivariate αναφέρεται σε περισσότερες από μία μεταβλητές. Μια πολυμεταβλητή στατιστική ανάλυση είναι μια ταυτόχρονη στατιστική ανάλυση περισσότερων από μία μεταβλητών τη φορά.
-
Δεξιότητες προγραμματισμού: Χρειάζεστε τις απαραίτητες δεξιότητες προγραμματισμού τόσο για να αναλύσετε τα ανεπεξέργαστα δεδομένα όσο και για να κάνετε αυτά τα δεδομένα προσβάσιμα στους επιχειρησιακούς χρήστες.
-
Επιχειρηματικές γνώσεις: Χρειάζεστε γνώση της επιχείρησης και του περιβάλλοντος για να κατανοήσετε καλύτερα τη συνάφεια των ευρημάτων σας.
Η επιστήμη των δεδομένων είναι μια πρωτοποριακή πειθαρχία. Οι επιστήμονες δεδομένων χρησιμοποιούν συχνά την επιστημονική μέθοδο για την εξερεύνηση δεδομένων, τη διαμόρφωση υποθέσεων και τη δοκιμή υποθέσεων (μέσω προσομοίωσης και στατιστικής μοντελοποίησης). Οι επιστήμονες δεδομένων με επίκεντρο τις επιχειρήσεις παράγουν πολύτιμες πληροφορίες, πολλές φορές διερευνούν τα πρότυπα και τις ανωμαλίες στα επιχειρηματικά δεδομένα. Η επιστήμη των δεδομένων σε ένα επιχειρηματικό πλαίσιο αποτελείται συνήθως από
-
Εσωτερικά και εξωτερικά σύνολα δεδομένων: Η επιστήμη των δεδομένων είναι ευέλικτη. Μπορείτε να δημιουργήσετε συγκεντρωτικά επιχειρηματικά δεδομένα από εσωτερικές και εξωτερικές πηγές δομημένων και αδόμητων δεδομένων αρκετά εύκολα. (A mash-up είναι συνδυασμός δύο ή περισσοτέρων πηγών δεδομένων που αναλύονται στη συνέχεια μαζί για να παρέχουν στους χρήστες μια πληρέστερη εικόνα της κατάστασης.)
-
Εργαλεία, τεχνολογίες και Συλλογές δεξιοτήτων: Τα παραδείγματα μπορούν να περιλαμβάνουν τη χρήση πλατφόρμων με βάση το σύννεφο, στατιστικού και μαθηματικού προγραμματισμού, μηχανικής μάθησης, ανάλυσης δεδομένων με Python και R και προηγμένης οπτικοποίησης δεδομένων.
Όπως και οι επιχειρηματικοί αναλυτές, οι επιστήμονες δεδομένων με επίκεντρο τις επιχειρήσεις παράγουν προϊόντα υποστήριξης αποφάσεων για διευθυντές επιχειρήσεων και οργανωτικούς ηγέτες που χρησιμοποιούν. Αυτά τα προϊόντα περιλαμβάνουν πίνακες ελέγχου αναλυτικών στοιχείων και οπτικοποιήσεις δεδομένων, αλλά γενικά δεν υπάρχουν πίνακες και πίνακες δεδομένων.
Δεδομένα χρήσιμα στην επιστήμη των δεδομένων
Μπορείτε να χρησιμοποιήσετε την επιστήμη δεδομένων για να αντλήσετε επιχειρησιακές πληροφορίες από τυποποιημένα σύνολα δομημένων επιχειρηματικών δεδομένων (όπως το BI) ή από δομημένα, ημιδομημένα και αδόμητα σύνολα μεγάλων δεδομένα.Οι λύσεις επιστήμης δεδομένων δεν περιορίζονται σε δεδομένα συναλλαγών που βρίσκονται σε μια σχεσιακή βάση δεδομένων. μπορείτε να χρησιμοποιήσετε την επιστήμη δεδομένων για να δημιουργήσετε πολύτιμες πληροφορίες από όλες τις διαθέσιμες πηγές δεδομένων. Αυτές οι πηγές δεδομένων περιλαμβάνουν
-
Στοιχεία συναλλακτικών δεδομένων: Μια δοκιμασμένη πηγή δεδομένων, τα επιχειρηματικά δεδομένα συναλλαγών είναι το είδος των δομημένων δεδομένων που χρησιμοποιούνται στην παραδοσιακή BI και περιλαμβάνουν δεδομένα διαχείρισης, δεδομένα εξυπηρέτησης πελατών, τα λειτουργικά δεδομένα και τα δεδομένα απόδοσης των εργαζομένων.
-
Τα κοινωνικά δεδομένα που σχετίζονται με το εμπορικό σήμα ή την επιχείρηση: Ένα πιο πρόσφατο φαινόμενο, τα δεδομένα που καλύπτει η ενότητα αυτή περιλαμβάνουν τα μη δομημένα δεδομένα που παράγονται μέσω μηνυμάτων ηλεκτρονικού ταχυδρομείου, άμεσων μηνυμάτων και κοινωνικών δικτύων όπως Twitter, Facebook, LinkedIn, και Instagram.
-
Δεδομένα μηχανής από επιχειρησιακές λειτουργίες: Τα μηχανήματα παράγουν αυτόματα αυτά τα μη δομημένα δεδομένα, όπως δεδομένα SCADA, δεδομένα μηχανών ή δεδομένα αισθητήρων.
Το ακρωνύμιο SCADA αναφέρεται σε S εποικοδομητική C ontrol και D ata A . Τα συστήματα SCADA χρησιμοποιούνται για τον έλεγχο των εξ αποστάσεως μηχανικών συστημάτων και εξοπλισμού. Παράγουν δεδομένα που χρησιμοποιούνται για την παρακολούθηση των λειτουργιών των μηχανημάτων και του εξοπλισμού.
-
Δεδομένα αρχείων ήχου, βίντεο, εικόνας και PDF: Αυτές οι καθιερωμένες μορφές είναι όλες πηγές μη δομημένων δεδομένων.
Τεχνολογίες και δεξιότητες χρήσιμα στην επιστήμη των δεδομένων
Δεδομένου ότι τα προϊόντα της επιστήμης των δεδομένων προέρχονται συχνά από μεγάλα δεδομένα, οι λύσεις πλατφόρμων δεδομένων που βασίζονται σε νέφος είναι κοινές στον τομέα. Τα δεδομένα που χρησιμοποιούνται στην επιστήμη των δεδομένων προέρχονται συχνά από μεγάλες λύσεις δεδομένων που έχουν κατασκευαστεί από δεδομένα, όπως Hadoop, MapReduce και Massive Parallel Processing.
Οι επιστήμονες δεδομένων είναι πρωτοποριακοί στοχαστές, οι οποίοι πρέπει συχνά να σκέφτονται έξω από το κουτί για να βρουν ακριβείς λύσεις στα προβλήματα που επιλύουν. Πολλοί επιστήμονες δεδομένων τείνουν προς λύσεις ανοιχτού κώδικα όταν είναι διαθέσιμες. Από απόψεως κόστους, αυτή η προσέγγιση ωφελεί τους οργανισμούς που απασχολούν αυτούς τους επιστήμονες.
Οι επιστήμονες των επιχειρήσεων που ασχολούνται με τις επιχειρήσεις μπορούν να χρησιμοποιούν τεχνικές εκμάθησης μηχανών για να βρίσκουν μοτίβα (και να αντλούν πληροφορίες) από τεράστια σύνολα δεδομένων που σχετίζονται με μια γραμμή επιχειρήσεων ή την επιχείρηση γενικότερα. Έχουν εξειδίκευση στα μαθηματικά, τις στατιστικές και τον προγραμματισμό, και μερικές φορές χρησιμοποιούν αυτές τις δεξιότητες για να δημιουργήσουν μοντέλα πρόβλεψης.
Γνωρίζουν γενικά πώς να προγραμματίζουν σε Python ή R. Οι περισσότεροι από αυτούς ξέρουν πώς να χρησιμοποιούν SQL για την αναζήτηση σχετικών δεδομένων από δομημένες βάσεις δεδομένων. Συνήθως είναι ειδικευμένοι στην επικοινωνία πληροφοριών για τους τελικούς χρήστες - στην επιστήμη των δεδομένων που βασίζεται στις επιχειρήσεις, οι τελικοί χρήστες είναι διευθυντές επιχειρήσεων και ηγετικές οργανώσεις. Οι επιστήμονες των δεδομένων πρέπει να είναι ικανά να χρησιμοποιούν λεκτικά, προφορικά και οπτικά μέσα για να μεταδώσουν πολύτιμες πληροφορίες.
Παρόλο που οι επιστήμονες δεδομένων με επίκεντρο τις επιχειρήσεις εξυπηρετούν έναν ρόλο υποστήριξης της λήψης αποφάσεων στην επιχείρηση, είναι διαφορετικοί από τον επιχειρηματικό αναλυτή στο ότι έχουν συνήθως ισχυρό ακαδημαϊκό και επαγγελματικό υπόβαθρο στα μαθηματικά, την επιστήμη, τη μηχανική ή όλα τα παραπάνω. Αυτό είπε, οι επιχειρηματίες-επιστήμονες δεδομένων έχουν επίσης μια ισχυρή ουσιαστική γνώση της διαχείρισης των επιχειρήσεων.