Βίντεο: Σύνταξη Βιογραφικού Σημειώματος 2024
Οι άνθρωποι χρησιμοποιούν την εμπειρία όταν ερμηνεύουν τα δεδομένα που βλέπουν, αλλά οι υπολογιστές δεν μπορούν. Το λογισμικό εξόρυξης δεδομένων θα κάνει ό, τι είναι δυνατόν για να προσδιορίσει το είδος των δεδομένων σε κάθε στήλη, αλλά οι τύποι δεδομένων είναι συχνά διφορούμενοι.
Όταν βλέπετε μια λίστα με τους ZIP Codes, δεν προσπαθείτε να τις προσθέσετε και να τις αφαιρέσετε. Ξέρετε ότι αντιπροσωπεύουν μέρη. Αυτό το καταλαβαίνετε επειδή έχετε πολλή εμπειρία που βλέπετε και αναγνωρίζετε ZIP Codes. Ένας υπολογιστής μπορεί να ερμηνεύσει έναν ταχυδρομικό κώδικα ως ακέραιο ή συνεχές μέτρο. Στο τέλος, εξαρτάται από εσάς να ορίσετε τη σωστή μορφή.
Οι λειτουργίες για τη ρύθμιση των μορφών δεδομένων και των ρόλων (όπως η ένδειξη της εξαρτώμενης μεταβλητής για μοντελοποίηση) μπορούν να ταφούν σε διάφορα σημεία της εφαρμογής εξόρυξης δεδομένων. Μπορείτε να ορίσετε τις μορφές και τον ρόλο των μεταβλητών μέσα σε ένα αρχείο δεδομένων, προτού ανοίξετε ακόμη μια εφαρμογή εξόρυξης δεδομένων (επιτρέπονται οι φυσικές μορφές δεδομένων για την Orange και την Weka), ως μέρος της εισαγωγής ή κάποτε αργότερα στη διαδικασία.
Μπορεί να έχετε εργαλεία που έχουν κατασκευαστεί για το σκοπό αυτό, όπως τα εργαλεία που εμφανίζονται στα παρακάτω σχήματα, ή μπορείτε να ορίσετε αυτές τις ιδιότητες σε άλλες διαδικασίες.
Κάθε εφαρμογή εξόρυξης δεδομένων έχει το δικό της σύνολο μεταβλητών τύπων και τα δικά της όρια για τον τρόπο με τον οποίο μπορεί να χρησιμοποιηθεί κάθε τύπος. Ορισμένα από αυτά τα όρια βασίζονται στη θεωρία. Για παράδειγμα, μπορείτε να προσθέσετε και να αφαιρέσετε μόνο αριθμούς, όχι γράμματα. Αλλά άλλοι μπορεί να είναι απλώς θέμα του πώς σχεδιάστηκε η εφαρμογή.
Έτσι, για παράδειγμα, μπορεί να διαπιστώσετε ότι ένα συγκεκριμένο εργαλείο μοντελοποίησης σε μία εφαρμογή σας επιτρέπει να προβλέπετε τόσο μεταβλητές κατηγορίας όσο και συνεχείς, αλλά ένα παρόμοιο εργαλείο σε άλλη εφαρμογή μπορεί να επιτρέψει τη μοντελοποίηση μόνο ενός ή του άλλου.