Βίντεο: Contain Yourself: An Intro to Docker and Containers by Nicola Kabar and Mano Marks 2024
Έχετε το σύνολο δεδομένων και το έχετε διαμορφώσει ώστε να ταιριάζει στις ανάγκες σας στο R, οπότε είστε έτοιμοι για την πραγματική δουλειά. Η ανάλυση των δεδομένων σας αρχίζει πάντα με την περιγραφή της. Με αυτό τον τρόπο μπορείτε να εντοπίσετε σφάλματα στα δεδομένα και μπορείτε να αποφασίσετε ποια μοντέλα είναι κατάλληλα για να λάβετε τις πληροφορίες που χρειάζεστε από τα δεδομένα που έχετε.
Ποια περιγραφικά στατιστικά στοιχεία χρησιμοποιείτε εξαρτάται φυσικά από τη φύση των δεδομένων σας.
Μερικές φορές ενδιαφέρεστε περισσότερο για τη γενική εικόνα των δεδομένων σας από ό, τι για τις μεμονωμένες τιμές. Μπορεί να σας ενδιαφέρει όχι τα χιλιόμετρα του κάθε αυτοκινήτου, αλλά στα μέσα χιλιόμετρα όλων των αυτοκινήτων από αυτό το σύνολο δεδομένων. Για αυτό, υπολογίζετε τον μέσο όρο χρησιμοποιώντας τη συνάρτηση mean (), όπως παρακάτω: >> mean (cars $ mpg) [1] 20. 09062
Μπορείτε επίσης να υπολογίσετε τον μέσο αριθμό κυλίνδρων αυτών των αυτοκινήτων, αλλά αυτό δεν έχει νόημα. Ο μέσος όρος θα είναι 6. 1875 κύλινδροι, και κανένα αυτοκίνητο δεν οδηγεί με ατελές κύλινδρο. Σε αυτή την περίπτωση, η μέση τιμή
- η πιο κεντρική τιμή στα δεδομένα σας - έχει μεγαλύτερη σημασία. Παίρνετε το διάμεσο από τη χρήση της διάταξης διάταξης (), όπως παρακάτω: