1.1 Una taca de tinta

En l'estiu de 2009, els telèfons mòbils sonaven per tota Rwanda. A més dels milions de trucades entre familiars, amics i socis de negocis, prop de 1.000 rwandesos van rebre una trucada de Joshua Blumenstock i els seus col·legues. Els investigadors estaven estudiant la riquesa i la pobresa mitjançant la realització d'un estudi de les persones que havien estat inclosos en la mostra a l'atzar d'una base de dades d'1,5 milions de clients de major proveïdor de telefonia mòbil de Rwanda. Blumenstock i els seus col·legues van demanar als participants si volien participar en una enquesta, expliquen la naturalesa de la investigació per a ells, i després es va fer una sèrie de preguntes sobre les seves característiques demogràfiques, socials i econòmiques.

Tot el que he dit fins ara fa que aquest so com un estudi tradicional de les ciències socials. Però, el que ve a continuació no és tradicional, almenys no encara. Es van utilitzar les dades de l'enquesta per entrenar un model d'aprenentatge de màquina per predir la riquesa d'algú de les seves dades de trucada, i després van utilitzar aquest model per estimar la riquesa dels 1,5 milions de clients. A continuació, s'estima que el lloc de residència dels 1,5 milions de clients mitjançant l'ús de la informació geogràfica incrustat en els registres de trucades. Posar aquestes dues estimacions junts, la riquesa estimada i el lloc de residència estimat-Blumenstock i els seus col·legues van ser capaços de produir estimacions d'alta resolució de la distribució geogràfica de la riquesa a Rwanda. En particular, es podria produir una riquesa estimada per a cadascuna de les cèl·lules de Rwanda 2.148, la unitat administrativa més petita del país.

Era impossible per validar aquestes estimacions perquè mai ningú s'havia produït estimacions per a aquest tipus d'àrees geogràfiques petites a Rwanda. Però, quan Blumenstock i els seus col·legues s'agreguen les seves estimacions per a 30 districtes de Rwanda, es van trobar que les seves estimacions van ser similars a les estimacions de l'Enquesta Demogràfica i de Salut, el patró or de les enquestes en els països en desenvolupament. Tot i aquests dos enfocaments produeixen estimacions similars en aquest cas, l'enfocament de Blumenstock i els seus col·legues era aproximadament 10 vegades més ràpid i 50 vegades més barat que les enquestes demogràfiques i de salut tradicionals. Aquestes estimacions de costos dramàticament més ràpides i inferior creen noves possibilitats per als investigadors, governs i empreses (Blumenstock, Cadamuro, and On 2015) .

A més de desenvolupar una nova metodologia, aquest estudi és una cosa així com un test de Rorschach; el que la gent veu depèn dels seus antecedents. Molts científics socials veuen una nova eina de mesurament que es pot utilitzar per posar a prova les teories sobre el desenvolupament econòmic. Molts científics de dades veuen un problema nou i genial d'aprenentatge automàtic. Molts empresaris veuen un enfocament poderós per a la posada en valor de les dades de rastreig digital que ja han recollit. Molts defensors de la privacitat veure un recordatori de por que vivim en un temps de vigilància massiva. Molts dels reguladors veuen de manera que la nova tecnologia pot ajudar a crear un món millor. De fet, aquest estudi és totes aquestes coses, i és per això que és una finestra cap al futur de la investigació social.