1.1 Ispisnom mrlja

U ljeto 2009. mobilni telefoni su zvonili diljem Ruande. Uz milijune poziva iz obitelji, prijatelja i poslovnih suradnika, oko 1.000 ruandaka primilo je poziv od Joshua Blumenstock i njegovih kolega. Ti su istraživači proučavali bogatstvo i siromaštvo provodeći istraživanje slučajnog uzorka ljudi iz baze podataka od 1,5 milijuna kupaca najvećeg pružatelja mobilnih telefona Ruande. Blumenstock i kolege pitali su slučajno odabrane ljude žele li sudjelovati u istraživanju, objasniti im prirodu istraživanja, a zatim su postavili niz pitanja o njihovim demografskim, društvenim i gospodarskim karakteristikama.

Sve što sam rekla do sada čini ovaj zvuk poput tradicionalnog istraživanja društvene znanosti. Ali ono što slijedi nije tradicionalno - barem još nije. Osim podataka ankete, Blumenstock i njegovi kolege također su imali potpuni zapis za pozive za svih 1,5 milijuna ljudi. Kombinirajući ova dva izvora podataka, korišteni su podaci ankete za osposobljavanje modela strojnog učenja za predviđanje bogatstva osobe na temelju njihovih zapisa o pozivima. Zatim su koristili ovaj model za procjenu bogatstva svih 1,5 milijuna korisnika u bazi podataka. Također su procijenili mjesta prebivališta svih 1,5 milijuna klijenata koristeći geografske informacije ugrađene u zapise poziva. Stavljajući sve ovo zajedno - procijenjeno bogatstvo i procijenjeno mjesto prebivališta - bili su u stanju proizvesti karte visoke razlučivosti geografske distribucije bogatstva u Ruandi. Konkretno, oni bi mogli procijeniti bogatstvo svakog od ruševskih 2.148 stanica, najmanjih administrativnih jedinica u zemlji.

Nažalost, nije bilo moguće potvrditi točnost tih procjena jer nitko nikada nije proizveo procjene za takva malena geografska područja u Ruandi. No, kada su Blumenstock i kolege agregirali svoje procjene na Ruande 30 okruga, otkrili su da su njihove procjene vrlo slične procjenama iz Ankete o demografskoj i zdravstvenoj zaštiti koja se široko smatra zlatnim standardom anketa u zemljama u razvoju. Iako su ova dva pristupa proizvela slične procjene u ovom slučaju, pristup Blumenstock i suradnika bio je oko 10 puta brži i 50 puta jeftiniji od tradicionalnih demografskih i zdravstvenih istraživanja. Te dramatično brže i niže procjene troškova stvaraju nove mogućnosti istraživačima, vladama i tvrtkama (Blumenstock, Cadamuro, and On 2015) .

Ova je studija slična testu Rorschach inkblot: ono što ljudi vide ovisi o njihovoj pozadini. Mnogi društveni znanstvenici vide novi alat za mjerenje koji se može koristiti za testiranje teorija o gospodarskom razvoju. Mnogi podaci znanstvenici vide cool novi problem strojnog učenja. Mnogi poslovni ljudi vide snažan pristup za otključavanje vrijednosti u velikim podacima koje su već prikupili. Mnogi zagovornici privatnosti vide stravični podsjetnik da živimo u vrijeme masovnog nadzora. Konačno, mnogi kreatori politike vide način na koji nova tehnologija može pomoći stvoriti bolji svijet. Zapravo, ovo istraživanje je sve te stvari, i zato što ima tu mješavinu karakteristika, vidim ga kao prozor u budućnost društvenih istraživanja.