1.1 A tinta blot

2009 nyarán mobiltelefonok csengtek egész Ruandában. A családoktól, barátoktól és üzleti munkatársaktól származó több millió híváson kívül mintegy 1000 ruandai hívást fogadott Joshua Blumenstocktól és kollégáitól. Ezek a kutatók a gazdagságot és a szegénységet tanulmányozták egy véletlenszerűen kiválasztott mintának felmérésével, amely egy 1,5 millió Ruanda legnagyobb mobiltelefon-szolgáltatójának adatbázisa. Blumenstock és munkatársai megkérdezték a véletlenszerűen kiválasztott embereket, hogy részt kívánnak venni egy felmérésben, megmagyarázzák nekik a kutatás jellegét, majd feltettek egy sor kérdést demográfiai, társadalmi és gazdasági jellemzőikről.

Mindaz, amit eddig mondtam, ez a hangzás, mint egy hagyományos társadalomtudományi felmérés. De ami következő, nem hagyományos - legalábbis még nem. A felmérési adatokon kívül Blumenstock és munkatársai 1,5 millió ember számára teljes körű nyilvántartást kaptak. E két adatforrás kombinálásával a felmérési adatokat egy gépi tanulási modell felkészítésére használták, hogy megjósolhassák egy személy vagyonát a hívásrekordok alapján. Ezt követően ezt a modellt használva becsülik meg az adatbázisban lévő összes 1.5 millió ügyféllel való gazdagságot. Azt is becsülték, hogy az 1.5 millió ügyfél tartózkodási helye a hívásrekordokba beágyazott földrajzi információk alapján történt. Mindez együttvéve - a becsült vagyont és a becsült lakóhelyet - képesek nagyszabású térképeket készíteni a vagyon földrajzi eloszlásáról Ruandában. Különösen a ruandai 2,148-as sejtekhez, az ország legkisebb adminisztratív egységéhez tartozhatnak becsült vagyon.

Sajnálatos módon lehetetlenné vált a becslések pontosságának érvényre juttatása, mivel senki sem készített becslést ilyen kis földrajzi területekre Ruandában. De amikor Blumenstock és kollégái összevonták becsléseiket Ruandai 30 körzetére, úgy találták, hogy becsléseik nagyon hasonlítanak a Demográfiai és Egészségügyi felmérés becsléseihez, amelyet széles körben a fejlődő országokban végzett felmérések aranyszabványaként tartanak számon. Bár ez a két megközelítés hasonló becsléseket eredményezett ebben az esetben, Blumenstock és munkatársai megközelítése körülbelül 10-szer gyorsabb és 50-szer olcsóbb volt, mint a hagyományos demográfiai és egészségügyi felmérések. Ezek a drámaian gyorsabb és alacsonyabb költségbecslések új lehetőségeket teremtenek kutatók, kormányok és vállalatok számára (Blumenstock, Cadamuro, and On 2015) .

Ez a tanulmány olyan, mint egy Rorschach inkblot teszt: amit az emberek látnak háttérük függvényében. Számos társadalomtudós lát el egy új mérési eszközt, amely felhasználható a gazdasági fejlődésre vonatkozó elméletek tesztelésére. Számos tudós látja a hűvös új gépi tanulási problémákat. Sok üzletember hatalmas megközelítést lát az értékek felszabadításában a már gyűjtött nagy adatokban. Számos adatvédelmi szószóló félelmetes emlékeztetőnek számít, hogy a tömeges megfigyelés idején élünk. Végül pedig sok döntéshozó úgy látja, ahogy az új technológia segíthet egy jobb világ megteremtésében. Valójában ez a tanulmány mindezek a dolgok, és mivel ez a tulajdonságok keveréke, úgy látom, mint egy ablak a társadalomkutatás jövőjébe.