1.1 Еден размачкана мастило

Во летото 2009 година, мобилни телефони ѕвонеа низ цела Руанда. Во прилог на милиони повици од семејството, пријателите и деловните соработници, околу 1.000 Руанди добија повик од Џошуа Блуменсток и неговите колеги. Овие истражувачи проучуваа богатство и сиромаштија со спроведување на анкета на случаен примерок на луѓе од базата на податоци од 1,5 милиони корисници на најголем мобилен оператор во Руанда. Blumenstock и колегите ги прашуваа случајно избраните луѓе ако сакаат да учествуваат во истражувањето, ја објаснија природата на истражувањето за нив, а потоа побараа низа прашања за нивните демографски, социјални и економски карактеристики.

Сè што досега го кажав ова го прави овој звук како традиционално истражување на општествените науки. Но, она што следува не е традиционално - барем не. Во прилог на податоците од истражувањето, Blumenstock и неговите колеги, исто така, имаа целосна евиденција на повици за сите 1,5 милиони луѓе. Со комбинирање на овие два извори на податоци, тие ги користеа податоците од истражувањето за да обучуваат модел за машинско учење за да го предвидат богатството на човекот врз основа на нивните записи за повици. Потоа, тие го користеа овој модел за да го проценат богатството на сите 1,5 милиони корисници во базата на податоци. Тие, исто така, ги проценуваа местата на живеење на сите 1,5 милиони корисници кои ги користеа географските информации вградени во записите за повици. Составувајќи сето ова заедно - проценетото богатство и проценетото место на живеење - тие можеа да создадат карти со висока резолуција за географската распределба на богатството во Руанда. Особено, тие би можеле да произведат проценето богатство за секоја 2148 Руанда клетки, најмалата административна единица во земјата.

За жал, невозможно беше да се потврди точноста на овие проценки, бидејќи никој досега не направи проценки за таквите мали географски области во Руанда. Но, кога Blumenstock и неговите колеги ги собраа своите проценки за 30-те области на Руанда, откриле дека нивните проценки се многу слични со проценките од Анкетата за демографски и здравствени истражувања, која се смета за златен стандард за истражувања во земјите во развој. Иако овие два пристапи произведоа слични проценки во овој случај, пристапот на Blumenstock и неговите колеги беше околу 10 пати побрз и 50 пати поевтин од традиционалните демографски и здравствени истражувања. Овие драматично побрзи и пониски проценки на трошоците создаваат нови можности за истражувачите, владите и компаниите (Blumenstock, Cadamuro, and On 2015) .

Оваа студија е вид на Rorschach inkblot тест: она што го гледаат луѓето зависи од нивната позадина. Многу научници од општеството гледаат нова мерна алатка која може да се користи за тестирање на теории за економски развој. Многу научници за податоци гледаат нов проблем за машинско учење. Многу деловни луѓе гледаат моќен пристап за отклучување на вредноста во големите податоци што веќе ги собрале. Многу застапници за заштита на приватноста гледаат страшно потсетување дека живееме во време на масовно надгледување. И конечно, многу креатори на политики гледаат начин на кој новата технологија може да помогне да се создаде подобар свет. Всушност, оваа студија е сите тие работи, и поради тоа што ја има оваа мешавина на карактеристики, ја гледам како прозорец во иднината на општествените истражувања.