Πίνακας περιεχομένων:
- Οι αναφορές υπολογιστικών φύλλων δημιουργούν αναποτελεσματικά μοντέλα δεδομένων
- Τα επίπεδα αρχεία δεδομένων προσφέρονται όμορφα σε μοντέλα δεδομένων
- Τα σύνολα δεδομένων πίνακα είναι ιδανικά για μοντέλα δεδομένων που βασίζονται σε πίνακες pivot
Βίντεο: Statistical Programming with R by Connor Harris 2025
Δεδομένου ότι το δομικό στοιχείο για το Excel σας αναφέρει, τα δεδομένα στα μοντέλα δεδομένων σας πρέπει να είναι κατάλληλα δομημένα. Δεν δημιουργούνται ίσα όλα τα σύνολα δεδομένων. Παρόλο που ορισμένα σύνολα δεδομένων λειτουργούν σε ένα τυπικό περιβάλλον Excel, ενδέχεται να μην λειτουργούν για σκοπούς μοντελοποίησης δεδομένων. Προτού δημιουργήσετε το μοντέλο δεδομένων σας, βεβαιωθείτε ότι τα δεδομένα προέλευσης είναι κατάλληλα δομημένα για σκοπούς ταμπλό.
Με κίνδυνο υπερπροσπάθειας, τα σύνολα δεδομένων που χρησιμοποιούνται συνήθως στο Excel έρχονται σε τρεις βασικές μορφές:
Το αρχείο υπολογιστικών φύλλων
Το επίπεδο αρχείο δεδομένων
Το πινακοποιημένο σύνολο δεδομένων
Η γραμμή διάτρησης είναι ότι μόνο επίπεδα αρχεία δεδομένων και πίνακες δεδομένων πίνακα δημιουργούν αποτελεσματικά μοντέλα δεδομένων.
Οι αναφορές υπολογιστικών φύλλων δημιουργούν αναποτελεσματικά μοντέλα δεδομένων
Αναφορές υπολογιστικών φύλλων εμφανίζουν εμφανώς μορφοποιημένα, συνοπτικά δεδομένα και συχνά σχεδιάζονται ως εργαλεία παρουσίασης για διευθυντές ή εκτελεστικούς χρήστες. Μια τυπική αναφορά υπολογιστικού φύλλου κάνει σωστή χρήση του κενού χώρου για μορφοποίηση, επαναλαμβάνει δεδομένα για αισθητικούς σκοπούς και παρουσιάζει μόνο ανάλυση υψηλού επιπέδου. Το παρακάτω σχήμα απεικονίζει μια αναφορά υπολογιστικού φύλλου.
Αν και μια αναφορά υπολογιστικού φύλλου μπορεί να φαίνεται ωραία, δεν δημιουργεί ένα αποτελεσματικό μοντέλο δεδομένων. Γιατί; Ο κύριος λόγος είναι ότι αυτές οι αναφορές δεν σας προσφέρουν διαχωρισμό δεδομένων, ανάλυσης και παρουσίασης. Είστε ουσιαστικά κλειδωμένοι σε μια ανάλυση.
Παρόλο που θα μπορούσατε να δημιουργήσετε διαγράμματα από την αναφορά που παρουσιάστηκε, θα ήταν ανέφικτο να εφαρμόσετε οποιαδήποτε ανάλυση έξω από αυτό που υπάρχει ήδη. Για παράδειγμα, πώς υπολογίζετε και παρουσιάζετε τον μέσο όρο όλων των πωλήσεων ποδηλάτων χρησιμοποιώντας αυτή τη συγκεκριμένη αναφορά; Πώς θα υπολογίσετε μια λίστα με τις δέκα καλύτερες αγορές με τις καλύτερες επιδόσεις;
Με αυτή τη ρύθμιση, είστε αναγκασμένοι σε πολύ χειροκίνητες διαδικασίες που είναι δύσκολο να διατηρηθούν κάθε μήνα. Οποιαδήποτε ανάλυση εκτός των υψηλού επιπέδου που υπάρχει ήδη στην έκθεση είναι βασική στην καλύτερη περίπτωση - ακόμη και με φανταχτερά τρόφιμα. Επιπλέον, τι συμβαίνει όταν πρέπει να προβάλλετε τις πωλήσεις ποδηλάτων κατά μήνα; Όταν το μοντέλο δεδομένων σας απαιτεί ανάλυση με δεδομένα που δεν περιλαμβάνονται στην αναφορά υπολογιστικού φύλλου, αναγκάζεται να αναζητήσετε ένα άλλο σύνολο δεδομένων.
Τα επίπεδα αρχεία δεδομένων προσφέρονται όμορφα σε μοντέλα δεδομένων
Ένας άλλος τύπος μορφής αρχείου είναι ένα επίπεδο αρχείο. Τα επίπεδη αρχεία είναι αποθετήρια δεδομένων που οργανώνονται ανά γραμμή και στήλη. Κάθε σειρά αντιστοιχεί σε ένα σύνολο στοιχείων δεδομένων ή μια εγγραφή . Κάθε στήλη είναι πεδίο . Ένα πεδίο αντιστοιχεί σε ένα μοναδικό στοιχείο δεδομένων σε μια εγγραφή. Ο ακόλουθος αριθμός περιέχει τα ίδια δεδομένα με την προηγούμενη αναφορά αλλά εκφράζεται σε μορφή επίπεδου αρχείου δεδομένων.
Ένα επίπεδο αρχείο δεδομένων.Παρατηρήστε ότι κάθε πεδίο δεδομένων έχει μια στήλη και κάθε στήλη αντιστοιχεί σε ένα στοιχείο δεδομένων. Επιπλέον, δεν υπάρχει επιπλέον απόσταση και κάθε σειρά (ή εγγραφή) αντιστοιχεί σε ένα μοναδικό σύνολο πληροφοριών. Αλλά το χαρακτηριστικό κλειδί που κάνει αυτό ένα επίπεδο αρχείο είναι ότι κανένα πεδίο δεν αναγνωρίζει μοναδικά ένα αρχείο. Στην πραγματικότητα, θα πρέπει να ορίσετε τέσσερα ξεχωριστά πεδία (περιοχή, αγορά, επιχειρηματικό τμήμα και ποσό των μηνών πωλήσεων) προτού μπορέσετε να προσδιορίσετε μοναδικά την εγγραφή.
Τα επίπεδη αρχεία προσφέρονται όμορφα στη μοντελοποίηση δεδομένων στο Excel επειδή μπορούν να είναι αρκετά λεπτομερείς για να κρατήσουν τα δεδομένα που χρειάζεστε και ακόμα να ευνοούν μια ευρεία σειρά αναλύσεων με απλούς τύπους - SUM, AVERAGE, VLOOKUP και SUMIF, μόνο για να ονομάστε μερικά.
Τα σύνολα δεδομένων πίνακα είναι ιδανικά για μοντέλα δεδομένων που βασίζονται σε πίνακες pivot
Πολλά αποτελεσματικά μοντέλα δεδομένων οδηγούνται κυρίως από πίνακες περιστροφής. Οι πίνακες περιστροφής είναι τα εργαλεία ανάλυσης της Excel του Excel. Για όσους από εσάς χρησιμοποιείτε συγκεντρωτικούς πίνακες, γνωρίζετε ότι προσφέρουν έναν εξαιρετικό τρόπο για να συνοψίσουμε και να διαμορφώσουμε τα δεδομένα για χρήση από την αναφορά στοιχείων, όπως τα διαγράμματα και τους πίνακες.
Οι πίνακες δεδομένων με πίνακες είναι ιδανικές για μοντέλα δεδομένων που βασίζονται σε πίνακες. Το παρακάτω σχήμα απεικονίζει ένα πίνακα δεδομένων. Σημειώστε ότι η κύρια διαφορά μεταξύ ενός πίνακα δεδομένων και ενός επίπεδου αρχείου δεδομένων είναι ότι σε πίνακες δεδομένων με πινακίδες οι ετικέτες στηλών δεν διπλασιάζονται ως πραγματικά δεδομένα. Για παράδειγμα, η στήλη "Περίοδος πωλήσεων" περιέχει τον αναγνωριστικό μήνα. Αυτή η λεπτή διαφορά στη δομή είναι αυτό που καθιστά τις πίνακες δεδομένων πίνακα τις βέλτιστες πηγές δεδομένων για τους πίνακες περιστροφής. Αυτή η δομή διασφαλίζει ότι οι βασικές λειτουργίες πίνακα περιστροφής, όπως η ταξινόμηση και η ομαδοποίηση, λειτουργούν όπως πρέπει.
Ένα πινακοποιημένο σύνολο δεδομένων.Τα χαρακτηριστικά ενός πίνακα δεδομένων πίνακα είναι τα εξής:
-
Η πρώτη σειρά του συνόλου δεδομένων περιέχει ετικέτες πεδίων που περιγράφουν τις πληροφορίες σε κάθε στήλη.
-
Οι ετικέτες στη στήλη δεν τραβούν διπλή εργασία ως στοιχεία δεδομένων που μπορούν να χρησιμοποιηθούν ως φίλτρα ή κριτήρια ερωτήματος (όπως μήνες, ημερομηνίες, έτη, περιοχές ή αγορές).
-
Δεν υπάρχουν κενές σειρές ή στήλες - κάθε στήλη έχει τίτλο και μια τιμή βρίσκεται σε κάθε σειρά.
-
Κάθε στήλη αντιπροσωπεύει μια μοναδική κατηγορία δεδομένων.
-
Κάθε σειρά αντιπροσωπεύει μεμονωμένα στοιχεία σε κάθε στήλη.