Βίντεο: ZEITGEIST 2 Addendum - Full Movie (Greek Subtitles) 2024
Τόσο η ομαδοποίηση όσο και η ταξινόμηση βασίζονται στον υπολογισμό της ομοιότητας ή της διαφοράς μεταξύ δύο σημείων δεδομένων. Εάν το σύνολο δεδομένων σας είναι αριθμητικό - αποτελείται μόνο από πεδία και τιμές αριθμών - και μπορεί να απεικονιστεί σε μια διαγράμμιση n , τότε υπάρχουν διάφορες γεωμετρικές μετρήσεις που μπορείτε να χρησιμοποιήσετε για την κλιμάκωση του πολυδιάστατου δεδομένα.
Ένα n-διάστατο γράφημα είναι ένα πολυδιάστατο διάγραμμα σκεδασμού σκεδασμού που μπορείτε να χρησιμοποιήσετε για να σχεδιάσετε n αριθμό διαστάσεων δεδομένων.
Ορισμένες δημοφιλείς γεωμετρικές μετρήσεις που χρησιμοποιούνται για τον υπολογισμό των αποστάσεων μεταξύ σημείων δεδομένων περιλαμβάνουν τις μετρήσεις απόστασης Euclidean, Manhattan ή Minkowski. Αυτές οι μετρήσεις είναι απλώς διαφορετικές γεωμετρικές λειτουργίες που είναι χρήσιμες για τη μοντελοποίηση αποστάσεων μεταξύ σημείων. Η ευκλείδεια μέτρηση είναι ένα μέτρο της απόστασης μεταξύ των σημείων που σχεδιάζονται σε ευκλείδειο επίπεδο.
Η μέτρηση του Μανχάταν είναι ένα μέτρο της απόστασης μεταξύ των σημείων όπου η απόσταση υπολογίζεται ως το άθροισμα της απόλυτης τιμής των διαφορών μεταξύ των καρτεσιανών συντεταγμένων δύο σημείων. Η απόσταση μέτρησης Minkowski είναι μια γενίκευση των μετρήσεων αποστάσεων Euclidean και Manhattan. Πολύ συχνά, αυτές οι μετρήσεις μπορούν να χρησιμοποιηθούν - εναλλακτικά.
διαφορών μεταξύ των δεδομένων αντί των πραγματικών τιμών τα ίδια τα δεδομένα. Τέλος, για μη-αριθμητικά δεδομένα, μπορείτε να χρησιμοποιήσετε μετρήσεις όπως η μέτρηση απόστασης Jaccard, που είναι ένας δείκτης που συγκρίνει τον αριθμό των χαρακτηριστικών που έχουν δύο κοινά σημεία δεδομένων. Για παράδειγμα, για να απεικονίσετε μια απόσταση Jaccard, σκεφτείτε τις δύο ακόλουθες σειρές κειμένου: Saint Louis de Ha-ha, Κεμπέκ και St-Louis de Ha! Χα!, QC.