1.1 Μια κηλίδα μελάνης

Το καλοκαίρι του 2009, τα κινητά τηλέφωνα κουδούνταν σε ολόκληρη τη Ρουάντα. Εκτός από τα εκατομμύρια των κλήσεων από την οικογένεια, τους φίλους και τους επιχειρηματικούς συνεργάτες, περίπου 1.000 Ρουάντες έλαβαν κλήση από τον Joshua Blumenstock και τους συναδέλφους του. Αυτοί οι ερευνητές μελετούσαν τον πλούτο και τη φτώχεια με τη διεξαγωγή έρευνας σε τυχαίο δείγμα ανθρώπων από μια βάση δεδομένων 1,5 εκατομμυρίων πελατών της μεγαλύτερης εταιρείας κινητής τηλεφωνίας της Ρουάντα. Οι Blumenstock και οι συνάδελφοί τους ρώτησαν τους τυχαία επιλεγμένους ανθρώπους εάν ήθελαν να συμμετάσχουν σε μια έρευνα, εξήγησαν τη φύση της έρευνας σε αυτούς και στη συνέχεια έθεσαν μια σειρά ερωτήσεων σχετικά με τα δημογραφικά, κοινωνικά και οικονομικά χαρακτηριστικά τους.

Όλα όσα έχω πει μέχρι τώρα κάνουν αυτό να ακούγεται σαν μια παραδοσιακή έρευνα κοινωνικών επιστημών. Αλλά αυτό που έρχεται έπειτα δεν είναι παραδοσιακό - τουλάχιστον όχι ακόμα. Εκτός από τα στοιχεία της έρευνας, η Blumenstock και οι συνεργάτες της είχαν επίσης πλήρη αρχεία κλήσεων για όλα τα 1,5 εκατομμύρια άτομα. Συνδυάζοντας αυτές τις δύο πηγές δεδομένων, χρησιμοποίησαν τα δεδομένα της έρευνας για να εκπαιδεύσουν ένα μοντέλο μηχανικής μάθησης για να προβλέψουν τον πλούτο ενός ατόμου με βάση τα αρχεία κλήσεων τους. Στη συνέχεια, χρησιμοποίησαν αυτό το μοντέλο για να εκτιμήσουν τον πλούτο όλων των 1,5 εκατομμυρίων πελατών στη βάση δεδομένων. Εκτίμησαν επίσης τους τόπους διαμονής όλων των 1,5 εκατομμυρίων πελατών χρησιμοποιώντας τις γεωγραφικές πληροφορίες που είναι ενσωματωμένες στα αρχεία κλήσεων. Κάνοντας όλα αυτά μαζί - τον εκτιμώμενο πλούτο και τον εκτιμώμενο τόπο διαμονής - ήταν σε θέση να παράγουν χάρτες υψηλής ανάλυσης της γεωγραφικής κατανομής του πλούτου στη Ρουάντα. Συγκεκριμένα, θα μπορούσαν να παράγουν έναν εκτιμώμενο πλούτο για κάθε μία από τις 2,148 κυψέλες της Ρουάντα, τη μικρότερη διοικητική μονάδα στη χώρα.

Δυστυχώς, ήταν αδύνατο να επικυρωθεί η ακρίβεια αυτών των εκτιμήσεων, διότι κανείς δεν παρήγαγε ποτέ εκτιμήσεις για τέτοιες μικρές γεωγραφικές περιοχές στη Ρουάντα. Αλλά όταν οι Blumenstock και οι συνάδελφοί τους συγκέντρωσαν τις εκτιμήσεις τους στις 30 περιοχές της Ρουάντα, διαπίστωσαν ότι οι εκτιμήσεις τους ήταν πολύ παρόμοιες με τις εκτιμήσεις της δημογραφικής και υγειονομικής έρευνας, η οποία θεωρείται ευρέως ότι είναι το χρυσό πρότυπο των ερευνών στις αναπτυσσόμενες χώρες. Αν και αυτές οι δύο προσεγγίσεις παρήγαγαν παρόμοιες εκτιμήσεις στην περίπτωση αυτή, η προσέγγιση των Blumenstock και των συναδέλφων ήταν περίπου 10 φορές ταχύτερη και 50 φορές φθηνότερη από τις παραδοσιακές δημογραφικές και υγειονομικές έρευνες. Αυτές οι δραματικά ταχύτερες και χαμηλότερες εκτιμήσεις κόστους δημιουργούν νέες δυνατότητες για τους ερευνητές, τις κυβερνήσεις και τις επιχειρήσεις (Blumenstock, Cadamuro, and On 2015) .

Αυτή η μελέτη είναι σαν μια δοκιμασία μελάνης Rorschach: αυτό που οι άνθρωποι βλέπουν εξαρτάται από το ιστορικό τους. Πολλοί κοινωνικοί επιστήμονες βλέπουν ένα νέο εργαλείο μέτρησης που μπορεί να χρησιμοποιηθεί για τη δοκιμή θεωριών σχετικά με την οικονομική ανάπτυξη. Πολλοί επιστήμονες δεδομένων βλέπουν ένα δροσερό νέο πρόβλημα μάθησης μηχανών. Πολλοί επιχειρηματίες βλέπουν μια ισχυρή προσέγγιση για την απελευθέρωση της αξίας στα μεγάλα δεδομένα που έχουν ήδη συλλέξει. Πολλοί υποστηρικτές της ιδιωτικής ζωής βλέπουν μια τρομακτική υπενθύμιση ότι ζούμε σε μια εποχή μαζικής επιτήρησης. Τέλος, πολλοί υπεύθυνοι για τη χάραξη πολιτικής βλέπουν έναν τρόπο με τον οποίο η νέα τεχνολογία μπορεί να συμβάλει στη δημιουργία ενός καλύτερου κόσμου. Στην πραγματικότητα, αυτή η μελέτη είναι όλα αυτά, και επειδή έχει αυτό το μείγμα χαρακτηριστικών, το βλέπω σαν ένα παράθυρο στο μέλλον της κοινωνικής έρευνας.