1.1 En blekk blot

I løpet av sommeren 2009, ble mobiltelefoner ringer over hele Rwanda. I tillegg til de millioner av samtaler mellom familie, venner og forretningsforbindelser, ca 1000 rwandere fikk en telefon fra Joshua Blumenstok og hans kolleger. Forskerne studerte rikdom og fattigdom ved å gjennomføre en undersøkelse av folk som hadde vært tilfeldig samplet fra en database med 1,5 millioner kunder fra Rwanda største mobilleverandør. Blumenstok og kolleger spurte deltakerne om de ønsket å delta i en undersøkelse, forklarte innholdet i forskningen til dem, og deretter spurt en rekke spørsmål om deres demografiske, sosiale og økonomiske kjennetegn.

Alt jeg har sagt til nå gjør dette høres ut som en tradisjonell samfunnsvitenskapelig undersøkelse. Men, hva som kommer etterpå er ikke tradisjonelle, i alle fall ikke ennå. De brukte undersøkelsen data til å trene en maskinlæring modell for å forutsi andres rikdom fra sine samtaledata, og da de brukte denne modellen for å beregne vell av alle 1,5 millioner kunder. Neste, de anslo bosted alle 1,5 millioner kunder ved hjelp av geografisk informasjon innebygd i samtalelogger. Å sette disse to estimatene sammen-estimert formue og estimert bosted-Blumenstok og kolleger var i stand til å gjøre estimater av den geografiske fordelingen av formue over Rwanda høy oppløsning. Spesielt kan de produsere en estimert formue for hver av Rwandas 2,148 celler, den minste administrative enhet i landet.

Det var umulig å validere disse estimatene fordi ingen noensinne hadde produsert estimater for slike små geografiske områder i Rwanda. Men når Blumenstok og kolleger samlet sine anslag til Rwandas 30 distrikter, fant de at deres anslag var lik estimater fra den demografiske og Health Survey, gullstandarden for undersøkelser i utviklingsland. Selv om disse to tilnærmingene produsert tilsvarende beregninger i dette tilfellet tilnærming av Blumenstok og kolleger var ca 10 ganger raskere og 50 ganger billigere enn de tradisjonelle demografiske og helseundersøkelser. Disse dramatisk raskere og lavere kostnadsanslag skape nye muligheter for forskere, myndigheter og selskaper (Blumenstock, Cadamuro, and On 2015) .

I tillegg til å utvikle en ny metode, er denne studien typen som en Rorschach inkblot test; hva folk ser, avhenger av deres bakgrunn. Mange samfunnsvitere se en ny måling verktøy som kan brukes til å teste teorier om økonomisk utvikling. Mange data forskere ser en kul ny maskinlæring problem. Mange forretningsfolk ser en kraftig tilnærming for å låse opp verdien i den digitale spor data som de allerede har samlet inn. Mange talsmenn ser en skremmende påminnelse om at vi lever i en tid med masse overvåking. Mange politikere ser en slik måte at ny teknologi kan bidra til å skape en bedre verden. Faktisk er denne studien alle disse tingene, og det er derfor det er et vindu inn i fremtiden for samfunnsforskning.