Βίντεο: Αποκαλύφθηκε το μεγαλύτερο σχέδιο απάτης με... 2024
Ο τεράστιος όγκος των συναλλαγών καθιστά πιο δύσκολο να εντοπιστεί η απάτη εξαιτίας του όγκου των δεδομένων, ειρωνικά, η ίδια πρόκληση μπορεί να συμβάλει στη δημιουργία καλύτερων προγνωστικών μοντέλων απάτης - ενός χώρου όπου λάμπει ο Hadoop.
Στον σημερινό διασυνδεδεμένο κόσμο, ο τεράστιος όγκος και η πολυπλοκότητα των συναλλαγών δυσκολεύει περισσότερο από ποτέ να βρει απάτη. Αυτό που ονομαζόταν "εύρεση βελόνας σε άχυρα" έχει γίνει το καθήκον της "εξεύρεσης συγκεκριμένης βελόνας σε στοίβες βελόνων. "
Οι παραδοσιακές προσεγγίσεις για την πρόληψη της απάτης δεν είναι ιδιαίτερα αποτελεσματικές. Για παράδειγμα, η διαχείριση ακατάλληλων πληρωμών διαχειρίζεται συχνά οι αναλυτές που ελέγχουν τι αντιπροσωπεύει ένα πολύ μικρό δείγμα αξιώσεων που συνδυάζεται με την υποβολή αιτήσεων ιατρικής τεκμηρίωσης από τους στοχοθετημένους υποψηφίους. Ο όρος βιομηχανίας για αυτό το μοντέλο είναι αμοιβή και κυνηγούν: Οι απαιτήσεις γίνονται αποδεκτές και καταβάλλονται και οι διαδικασίες αναζητούν εκ προθέσεως ή ακούσια υπερπληρωμές μέσω της επανεξέτασης μετά την πληρωμή αυτών των αξιώσεων.
Πώς γίνεται τώρα η ανίχνευση απάτης; Λόγω των περιορισμών των παραδοσιακών τεχνολογιών, τα μοντέλα απάτης δημιουργούνται με δεδομένα δειγματοληψίας και χρησιμοποιώντας το δείγμα για τη δημιουργία ενός συνόλου μοντέλων πρόβλεψης απάτης και ανίχνευσης. Όταν συγκρίνετε αυτό το μοντέλο με ένα τμήμα Hudaop-anchored fraud που χρησιμοποιεί το πλήρες σύνολο δεδομένων - χωρίς δειγματοληψία - για να δημιουργήσετε τα μοντέλα, μπορείτε να δείτε τη διαφορά.
Το πιο συνηθισμένο επαναλαμβανόμενο θέμα που βλέπετε στις περισσότερες περιπτώσεις χρήσης Hadoop είναι ότι βοηθά τις επιχειρήσεις να σπάσουν το γυάλινο ταβάνι στον όγκο και την ποικιλία των δεδομένων που μπορούν να ενσωματωθούν στην ανάλυση αποφάσεων. Τα περισσότερα δεδομένα που έχετε (και όσο περισσότερη ιστορία αποθηκεύετε), τόσο καλύτερα είναι τα μοντέλα σας.
Η ανάμειξη μη παραδοσιακών μορφών δεδομένων με το σύνολο των ιστορικών συναλλαγών μπορεί να κάνει τα μοντέλα απάτης σας ακόμα πιο ισχυρά. Για παράδειγμα, εάν ένας εργαζόμενος υποβάλει αξίωση αποζημίωσης εργαζομένου για μια κακή πλάτη από ένα περιστατικό ολίσθησης και πτώσης, έχοντας μια ομάδα εκατομμυρίων περιπτώσεων έκβασης ασθενούς, η λεπτομερής επεξεργασία και η διάρκεια της ανάκτησης βοηθούν στη δημιουργία ενός προτύπου ανίχνευσης για απάτη.
Ως παράδειγμα του τρόπου με τον οποίο μπορεί να λειτουργήσει αυτό το μοντέλο, φανταστείτε ότι προσπαθείτε να μάθετε αν οι ασθενείς στις αγροτικές περιοχές ανακτούν πιο αργά από εκείνους των αστικών περιοχών. Μπορείτε να ξεκινήσετε εξετάζοντας την εγγύτητα με τις υπηρεσίες φυσιοθεραπείας. Υπάρχει συσχέτιση μεταξύ των χρόνων ανάκτησης και της γεωγραφικής θέσης;
Εάν το τμήμα απάτης διαπιστώσει ότι κάποιος τραυματισμός χρειάζεται τρεις εβδομάδες ανάκαμψης, αλλά ένας αγρότης με την ίδια διάγνωση ζει μία ώρα από έναν φυσιοθεραπευτή και ο υπάλληλος γραφείου έχει έναν ιατρό στο γραφείο του, αυτή είναι μια άλλη μεταβλητή που προσθέτει στην απάτη - μοτίβο ανίχνευσης.
Όταν συγκεντρώνετε δεδομένα κοινωνικού δικτύου για τους αιτούντες και βρίσκετε έναν ασθενή που ισχυρίζεται ότι υποφέρει από whiplash, μπορεί να υπερηφανεύεται για την ολοκλήρωση της τραχιάς σειράς συμβάντων αντοχής γνωστών ως Tough Mudder, είναι ένα παράδειγμα ανάμιξης νέων ειδών δεδομένων με παραδοσιακές μορφές δεδομένων για να εντοπίσουν την απάτη.
Αν θέλετε να κλωτσήσετε τις προσπάθειες ανίχνευσης απάτης σε υψηλότερη ταχύτητα, ο οργανισμός σας μπορεί να εργαστεί για να απομακρυνθεί από τη μοντελοποίηση τμήματος της αγοράς και να προχωρήσει προς τη μοντελοποίηση σε επίπεδο συναλλαγής ή σε επίπεδο ατόμου.
Πολύ απλά, κάνοντας μια πρόβλεψη βασισμένη σε ένα τμήμα είναι χρήσιμη, αλλά η λήψη απόφασης με βάση συγκεκριμένες πληροφορίες για μια μεμονωμένη συναλλαγή είναι (προφανώς) καλύτερη. Για να γίνει αυτό, επεξεργάζεστε ένα μεγαλύτερο σύνολο δεδομένων από ό, τι συμβατικά είναι δυνατό στην παραδοσιακή προσέγγιση. Μόνο (το πολύ) το 30% των διαθέσιμων πληροφοριών που μπορεί να είναι χρήσιμες για τη μοντελοποίηση απάτης χρησιμοποιείται.
Για τη δημιουργία μοντέλων ανίχνευσης απάτης, ο Hadoop είναι κατάλληλος για
-
Χειρισμός όγκου: Αυτό σημαίνει επεξεργασία ολόκληρου του συνόλου δεδομένων - χωρίς δειγματοληψία δεδομένων.
-
Διαχείριση νέων ποικιλιών δεδομένων: Παραδείγματα είναι η συμπερίληψη των υπηρεσιών εγγύτητας-φροντίδας και των κοινωνικών κύκλων για τη διακόσμηση του μοντέλου απάτης.
-
Διατηρήστε ένα ευκίνητο περιβάλλον: Ενεργοποιήστε διαφορετικά είδη ανάλυσης και αλλαγές στα υπάρχοντα μοντέλα.
Οι μοντελιστές απάτης μπορούν να προσθέσουν και να δοκιμάσουν νέες μεταβλητές στο μοντέλο χωρίς να χρειαστεί να υποβάλουν πρόταση στη διοικητική ομάδα της βάσης δεδομένων σας και στη συνέχεια να περιμένουν μερικές εβδομάδες για να εγκρίνουν μια αλλαγή σχήματος και να την τοποθετήσουν στο περιβάλλον τους.
Αυτή η διαδικασία είναι κρίσιμη για την ανίχνευση της απάτης, επειδή τα δυναμικά περιβάλλοντα έχουν συνήθως κυκλικά πρότυπα απάτης που έρχονται και μεταβαίνουν σε ώρες, ημέρες ή εβδομάδες. Εάν τα δεδομένα που χρησιμοποιούνται για τον εντοπισμό ή την ενίσχυση νέων μοντέλων ανίχνευσης απάτης δεν είναι διαθέσιμα σε κάποια στιγμή, μέχρι να ανακαλύψετε αυτά τα νέα πρότυπα, θα μπορούσε να είναι πολύ αργά για να αποφευχθούν ζημίες.
Αξιολογήστε το όφελος για την επιχείρησή σας όχι μόνο να δημιουργήσετε πιο ολοκληρωμένα μοντέλα με περισσότερους τύπους δεδομένων αλλά και να ανανεώσετε και να βελτιώσετε αυτά τα μοντέλα πιο γρήγορα από ποτέ. Η εταιρεία που μπορεί να ανανεώνει και να βελτιώνει τα μοντέλα καθημερινά θα ταιριάζει καλύτερα από αυτά που το κάνουν κάθε τρίμηνο.
Μπορεί να πιστεύετε ότι αυτό το πρόβλημα έχει μια απλή απάντηση - απλώς ζητήστε από τις εγκρίσεις CIO για επιχειρησιακές δαπάνες (OPEX) και κεφαλαιουχικές δαπάνες (CAPEX) να συμπεριλάβετε περισσότερα δεδομένα για να κάνετε καλύτερα μοντέλα και να φορτώσετε το άλλο 70% μοντέλα αποφάσεων.
Μπορείτε ακόμη και να πιστέψετε ότι αυτή η επένδυση θα πληρώσει για τον εαυτό της με την καλύτερη ανίχνευση της απάτης. Ωστόσο, το πρόβλημα με αυτήν την προσέγγιση είναι το υψηλό αρχικό κόστος που πρέπει να βυθιστεί σε δεδομένα άγνωστα , όπου δεν γνωρίζετε αν περιέχει μια πραγματικά πολύτιμη διορατικότητα.
Σίγουρα, τριπλασιάζοντας το μέγεθος της αποθήκης δεδομένων σας, για παράδειγμα, θα σας δοθεί περισσότερη πρόσβαση σε δομημένα ιστορικά δεδομένα για να τελειοποιήσετε τα μοντέλα σας, αλλά δεν μπορούν να φιλοξενήσουν εκρήξεις κοινωνικών μέσων. Οι παραδοσιακές τεχνολογίες δεν είναι τόσο ευκίνητες. Ο Hadoop διευκολύνει την εισαγωγή νέων μεταβλητών στο μοντέλο και αν αποδειχθεί ότι δεν έχουν βελτιώσει το μοντέλο, μπορείτε απλά να απορρίψετε τα δεδομένα και να προχωρήσετε.