1.1 En blækklat

I sommeren 2009 ringede mobiltelefoner over hele Rwanda. Ud over de millioner af opkald fra familie, venner og forretningsforbindelser modtog omkring 1.000 rwandere et opkald fra Joshua Blumenstock og hans kolleger. Disse forskere studerede rigdom og fattigdom ved at gennemføre en undersøgelse af en tilfældig stikprøve af personer fra en database med 1,5 millioner kunder fra Rwandas største mobiludbyder. Blumenstock og kolleger bad de tilfældigt udvalgte personer, hvis de ønskede at deltage i en undersøgelse, forklarede arten af ​​forskningen til dem og derefter stillede en række spørgsmål om deres demografiske, sociale og økonomiske karakteristika.

Alt hvad jeg har sagt indtil videre lyder det som en traditionel samfundsvidenskabsundersøgelse. Men hvad der kommer næste er ikke traditionelt - i hvert fald ikke endnu. Ud over undersøgelsesdataene havde Blumenstock og kolleger også komplette opkaldsregistre for alle 1,5 millioner mennesker. Ved at kombinere disse to datakilder, brugte de undersøgelsesdataene til at træne en maskinindlæringsmodel for at forudsige en persons rigdom baseret på deres opkaldsposter. Dernæst brugte de denne model til at estimere værdien af ​​alle 1,5 millioner kunder i databasen. De anslog også bosætningsstederne for alle 1,5 millioner kunder ved hjælp af de geografiske oplysninger, der er indlejret i opkaldsrekordene. Sammen med alt dette - den anslåede formue og det anslåede bopæl - de kunne producere kort med høj opløsning af den geografiske fordeling af rigdom i Rwanda. De kunne især producere et estimeret rigdom for hver af Rwandas 2.148 celler, den mindste administrative enhed i landet.

Desværre var det umuligt at validere nøjagtigheden af ​​disse estimater, fordi ingen nogensinde havde lavet skøn for sådanne små geografiske områder i Rwanda. Men da Blumenstock og kolleger aggregerede deres estimater til Rwandas 30 distrikter, fandt de, at deres skøn lignede meget de estimater fra demografiske og sundhedsundersøgelser, som generelt anses for at være guldstandarden for undersøgelser i udviklingslande. Selvom disse to fremgangsmåder frembragte lignende skøn i denne sag, var tilgangen til Blumenstock og kolleger omkring 10 gange hurtigere og 50 gange billigere end de traditionelle demografiske og sundhedsundersøgelser. Disse dramatisk hurtigere og lavere omkostningsoverslag skaber nye muligheder for forskere, regeringer og virksomheder (Blumenstock, Cadamuro, and On 2015) .

Denne undersøgelse er lidt som en Rorschach inkblot test: hvad folk ser afhænger af deres baggrund. Mange socialforskere ser et nyt måleværktøj, som kan bruges til at teste teorier om økonomisk udvikling. Mange dataforskere ser et køligt nyt maskinindlæringsproblem. Mange forretningsfolk ser en stærk tilgang til at låse op for værdien i de store data, de allerede har samlet. Mange privatlivspolitikker ser en skræmmende påmindelse om, at vi lever i en tid med massovervågning. Og endelig ser mange politiske beslutningstagere en måde, at ny teknologi kan bidrage til at skabe en bedre verden. Faktisk er denne undersøgelse alle disse ting, og fordi den har denne blanding af egenskaber, ser jeg det som et vindue ind i fremtiden for social forskning.