1.1 En blækklat

I sommeren 2009 blev mobiltelefoner ringer hele Rwanda. Ud over de millioner af opkald mellem familie, venner og forretningsforbindelser, omkring 1.000 rwandere modtaget et opkald fra Joshua Blumenstock og hans kolleger. Forskerne studerede rigdom og fattigdom ved at gennemføre en undersøgelse af mennesker, der var blevet tilfældigt stikprøven fra en database med 1,5 millioner kunder fra Rwanda største mobiltelefon udbyder. Blumenstock og kolleger spurgte deltagerne, hvis de ønskede at deltage i en undersøgelse, forklarede arten af ​​den forskning til dem, og spurgte en række spørgsmål om deres demografiske, sociale og økonomiske karakteristika.

Alt hvad jeg har sagt indtil nu gør denne lyd som en traditionel samfundsvidenskabelig undersøgelse. Men, hvad bliver det næste er ikke traditionelle, i hvert fald ikke endnu. De brugte undersøgelsens data til at træne en maskine læringsmodel til at forudsige en persons rigdom fra deres opkaldsdata, og så brugte denne model til at estimere rigdom af alle 1,5 millioner kunder. Dernæst de anslået bopæl alle 1,5 millioner kunder ved hjælp af geografiske oplysninger indlejret i opkaldslister. Sætte disse to estimater sammen-det anslåede rigdom og den anslåede bopæl-Blumenstock og kolleger var i stand til at producere estimater af den geografiske fordeling af rigdom tværs Rwanda høj opløsning. Navnlig kunne de producerer en anslået formue for hver af Rwandas 2.148 celler, den mindste administrative enhed i landet.

Det var umuligt at validere disse skøn, fordi ingen nogensinde havde produceret estimater for sådanne små geografiske områder i Rwanda. Men, da Blumenstock og kolleger aggregeret deres skøn til Rwandas 30 distrikter, fandt de, at deres skøn var magen til skøn fra den demografiske og Health Survey, guldstandarden af ​​undersøgelser i udviklingslandene. Selv om disse to tilgange producerede lignende skøn i denne sag, tilgangen i Blumenstock og kolleger var omkring 10 gange hurtigere og 50 gange billigere end de traditionelle demografiske og sundhedsmæssige Surveys. Disse dramatisk hurtigere og lavere prisoverslag skabe nye muligheder for forskere, regeringer og virksomheder (Blumenstock, Cadamuro, and On 2015) .

Ud over at udvikle en ny metode, denne undersøgelse er lidt ligesom en Rorschach blækklat test; hvad folk ser, afhænger af deres baggrund. Mange samfundsforskere ser en ny måling værktøj, der kan bruges til at teste teorier om den økonomiske udvikling. Mange data forskerne se en cool ny maskine learning problem. Mange forretningsfolk ser en kraftfuld metode til oplåsning værdi i den digitale spor data, de allerede har indsamlet. Mange privatliv fortalere ser en skræmmende påmindelse om, at vi lever i en tid med masse overvågning. Mange politikere se en måde at ny teknologi kan bidrage til at skabe en bedre verden. Faktisk denne undersøgelse er alle disse ting, og det er derfor, det er et vindue ind i fremtiden for social forskning.