1.1 Una taca de tinta

A l'estiu de 2009, els telèfons mòbils estaven cridant a tot Rwanda. A més dels milions de trucades de familiars, amics i empreses associades, uns 1.000 ruandesos van rebre una trucada de Joshua Blumenstock i els seus col·legues. Aquests investigadors estudien la riquesa i la pobresa realitzant una enquesta d'una mostra aleatòria de persones d'una base de dades d'1,5 milions de clients del proveïdor de telefonia mòbil més gran de Rwanda. Blumenstock i els seus col · legues van demanar a les persones seleccionades aleatòriament si volien participar en una enquesta, van explicar la naturalesa de la investigació i després van fer una sèrie de preguntes sobre les seves característiques demogràfiques, socials i econòmiques.

Tot el que he dit fins ara fa que això soni com una enquesta de ciència social tradicional. Però el que ve després no és tradicional, almenys encara no. A més de les dades de l'enquesta, Blumenstock i col·legues també van tenir registres de trucades complets per a tots els 1,5 milions de persones. Combinant aquestes dues fonts de dades, van utilitzar les dades de l'enquesta per formar un model d'aprenentatge automàtic per predir la riquesa d'una persona segons els seus registres de trucades. A continuació, van utilitzar aquest model per estimar la riquesa de tots els 1,5 milions de clients de la base de dades. També van estimar els llocs de residència de tots els 1,5 milions de clients que utilitzaven la informació geogràfica inserida en els registres de la trucada. Posant tot això en conjunt: la riquesa estimada i el lloc de residència estimat, van poder produir mapes d'alta resolució sobre la distribució geogràfica de la riquesa a Rwanda. En particular, podrien produir una riquesa estimada per a cadascuna de les 2.148 cel·les de Rwanda, la unitat administrativa més petita del país.

Malauradament, no era possible validar l'exactitud d'aquestes estimacions perquè ningú havia produït estimacions per a petites àrees geogràfiques a Rwanda. Però quan Blumenstock i els seus col·legues van agregar les seves estimacions als 30 districtes de Rwanda, van trobar que les seves estimacions eren molt similars a les estimacions de l'Enquesta demogràfica i de salut, que es consideren àmpliament considerades com les normes d'or de les enquestes als països en desenvolupament. Encara que aquests dos enfocaments van produir estimacions similars en aquest cas, l'enfocament de Blumenstock i col·legues era aproximadament 10 vegades més ràpid i 50 vegades més barat que les tradicionals Demographic and Health Surveys. Aquestes estimacions de costos dràsticament més ràpides i més baixes creen noves possibilitats per a investigadors, governs i empreses (Blumenstock, Cadamuro, and On 2015) .

Aquest estudi és semblant a una prova d'injecció de tinta de Rorschach: el que la gent veu depèn dels seus antecedents. Molts científics socials veuen una nova eina de mesura que pot utilitzar-se per provar teories sobre el desenvolupament econòmic. Molts científics de dades veuen un problema nou d'aprenentatge automàtic. Molts empresaris veuen un enfocament potent per desbloquejar el valor en les grans dades que ja han recollit. Molts advocats de la privadesa recorden que vivim en un moment de vigilància massiva. I, finalment, molts responsables polítics veuen que la nova tecnologia pot ajudar a crear un món millor. De fet, aquest estudi és tot això, i perquè té aquesta barreja de característiques, ho veig com una finestra cap al futur de la investigació social.