1.1 En bläckplump

Under sommaren 2009 ringde mobiltelefoner över Rwanda. Förutom de miljontals samtalen från familj, vänner och affärsrelaterade samtal, fick cirka 1000 rwandan ett samtal från Joshua Blumenstock och hans kollegor. Dessa forskare studerade rikedom och fattigdom genom att göra en undersökning av ett slumpmässigt urval av personer från en databas på 1,5 miljoner kunder från Rwandas största mobilleverantör. Blumenstock och kollegor frågade de slumpmässigt utvalda personerna om de ville delta i en undersökning, förklarade forskningen för dem och frågade sedan en rad frågor om deras demografiska, sociala och ekonomiska egenskaper.

Allt jag har sagt hittills gör det här som en traditionell samhällsvetenskaplig undersökning. Men vad som kommer nästa är inte traditionellt-åtminstone inte än. Utöver undersökningsuppgifterna hade Blumenstock och kollegor även fullständiga samtalsrekord för alla 1,5 miljoner människor. Genom att kombinera dessa två datakällor använde de undersökningsdata för att utbilda en maskininlärningsmodell för att förutsäga en persons förmögenhet utifrån sina samtalsposter. Därefter använde de den här modellen för att uppskatta riket av alla 1,5 miljoner kunder i databasen. De uppskattade också bostadsorterna för alla 1,5 miljoner kunder med hjälp av den geografiska informationen inbäddad i samtalsrekorden. Genom att sammanfatta allt detta - den beräknade förmögenheten och den beräknade bostaden - de kunde producera kartor med hög upplösning av den geografiska fördelningen av rikedom i Rwanda. I synnerhet kunde de producera en beräknad rikedom för var och en av Rwandas 2148 celler, den minsta administrativa enheten i landet.

Tyvärr var det omöjligt att validera noggrannheten som dessa uppskattar eftersom ingen någonsin hade producerat uppskattningar för sådana små geografiska områden i Rwanda. Men när Blumenstock och kollegor aggregerade sina uppskattningar till Rwandas 30 distrikt fann de att deras uppskattningar var väldigt lika beräkningar från demografiska och hälsokunden, vilket allmänt anses vara guldstandarden för undersökningar i utvecklingsländer. Även om dessa två tillvägagångssätt gav liknande uppskattningar i detta fall var tillvägagångssättet för Blumenstock och kollegor cirka 10 gånger snabbare och 50 gånger billigare än de traditionella demografiska och hälsokunderna. Dessa dramatiskt snabbare och lägre kostnadsberäkningar skapar nya möjligheter för forskare, regeringar och företag (Blumenstock, Cadamuro, and On 2015) .

Denna studie är typ av som ett Rorschach inkblot-test: vad folk ser beror på deras bakgrund. Många socialforskare ser ett nytt mätverktyg som kan användas för att testa teorier om ekonomisk utveckling. Många datavetenskapare ser ett coolt nytt lärandeproblem. Många affärsmän ser ett kraftfullt sätt att låsa upp värde i de stora data som de redan har samlat in. Många integritetsförespråkare ser en skrämmande påminnelse om att vi lever i en tid av massövervakning. Och slutligen ser många politiska beslutsfattare ett sätt att ny teknik kan bidra till att skapa en bättre värld. Faktum är att denna studie är alla dessa saker, och eftersom den har denna blandning av egenskaper ser jag det som ett fönster in i socialforskningens framtid.