1.1 Atramentová škvrna

V lete 2009 mobilné telefóny zvonili po celej Rwande. Okrem miliónov hovorov od rodiny, priateľov a obchodných partnerov dostal hovor od Joshua Blumenstock a jeho kolegov približne 1000 Rwandanov. Títo vedci študovali bohatstvo a chudobu tým, že vykonali prieskum náhodnej vzorky ľudí z databázy 1,5 milióna zákazníkov najväčšieho poskytovateľa mobilných telefónov v Rwande. Blumenstock a kolegovia požiadali náhodne vybraných ľudí, aby sa zúčastnili prieskumu, vysvetlili povahu výskumu a potom požiadali rad otázok o ich demografických, sociálnych a ekonomických charakteristikách.

Všetko, čo som doteraz povedal, to znie ako tradičný prieskum sociálnych vied. Ale to, čo príde ďalej, nie je tradične - aspoň zatiaľ nie. Okrem údajov z prieskumov mala Blumenstock a kolegovia aj kompletné záznamy o volaniach pre všetkých 1,5 milióna ľudí. Kombináciou týchto dvoch zdrojov údajov použili údaje z prieskumu na prípravu modelu strojového učenia, aby predpovedali bohatstvo osoby na základe záznamov o hovoroch. Ďalej použili tento model na odhadnutie bohatstva všetkých 1,5 milióna zákazníkov v databáze. Tiež odhadli miesta bydliska všetkých 1,5 milióna zákazníkov, ktorí použili geografické informácie vložené do záznamov hovorov. Spájajúc to všetko - odhadované bohatstvo a odhadované miesto pobytu - dokázali vytvoriť mapy s vysokým rozlíšením o geografickom rozložení bohatstva v Rwande. Najmä by mohli vytvoriť odhadované bohatstvo pre každú z 2 148 buniek v Rwande, čo je najmenšia administratívna jednotka v krajine.

Bohužiaľ nebolo možné potvrdiť presnosť týchto odhadov, pretože nikto nikdy nevytvoril odhady pre takéto malé geografické oblasti v Rwande. Ale keď Blumenstock a kolegovia zhrnuli svoje odhady do 30 okresov v Rwande, zistili, že ich odhady sú veľmi podobné odhadom z demografického a zdravotného prieskumu, ktorý sa všeobecne považuje za zlatý štandard prieskumov v rozvojových krajinách. Hoci tieto dva prístupy v tomto prípade priniesli podobné odhady, prístup Blumenstocka a jeho kolegov bol asi desaťkrát rýchlejší a 50 krát lacnejší ako tradičné demografické a zdravotné prieskumy. Tieto dramaticky rýchlejšie a nižšie odhady nákladov vytvárajú nové možnosti pre výskumníkov, vlády a spoločnosti (Blumenstock, Cadamuro, and On 2015) .

Táto štúdia je trochu ako test Rorschach inkblot: to, čo ľudia vidia, závisí od ich pozadia. Mnohí sociálni vedci vidia nový merací nástroj, ktorý možno použiť na testovanie teórií o hospodárskom rozvoji. Mnohí vedeckí pracovníci v oblasti údajov vidia problém s novým počítačom. Mnoho podnikateľov vidí silný prístup k odomknutiu hodnoty vo veľkých údajoch, ktoré už zhromaždili. Mnohí obhajcovia súkromia vidia desivú pripomienku, že žijeme v čase hromadného dohľadu. A nakoniec mnohí tvorcovia politík vidia spôsob, akým nové technológie pomôžu vytvoriť lepší svet. V skutočnosti je táto štúdia všetkými týmito vecami a preto, že má túto kombináciu vlastností, vidím to ako okná do budúcnosti sociálneho výskumu.