1.1 Inkoustová skvrna

V létě 2009 mobilní telefony zvonily po celém Rwandě. Kromě milionů telefonátů od rodin, přátel a obchodních partnerů dostalo 1,000 Rwandanů volání od Joshua Blumenstocka a jeho kolegů. Tito vědci zkoumali bohatství a chudobu tím, že provedli průzkum náhodného vzorku lidí z databáze 1,5 milionu zákazníků největšího poskytovatele mobilních telefonů v Rwandě. Blumenstock a kolegové se od náhodně vybraných lidí zeptali, zda se chtějí zúčastnit průzkumu, vysvětlili jim povahu výzkumu a poté se zeptali na řadu otázek týkajících se jejich demografických, sociálních a ekonomických charakteristik.

Všechno, co jsem řekl, dělá to jako tradiční průzkum společenských věd. Ale co přijde dále, není tradiční - přinejmenším ne. Kromě údajů z průzkumů měla Blumenstock a kolegové také kompletní záznamy o volání pro všech 1,5 milionů lidí. Kombinace těchto dvou zdrojů dat využila údaje z průzkumů pro výuku modelu strojového učení pro předpovídání bohatství osoby na základě záznamů o volání. Dále použili tento model k odhadnutí bohatství všech 1,5 milionu zákazníků v databázi. Také odhadli místa bydliště všech 1,5 milionu zákazníků, kteří používali geografické informace obsažené v záznamu hovorů. Všechno to spojilo - odhadované bohatství a odhadované místo bydliště - dokázaly vytvořit mapy s vysokým rozlišením geografického rozložení bohatství v Rwandě. Zejména by mohly produkovat odhadované bohatství pro každou z 2 148 buněk v Rwandě, nejmenší administrativní jednotku v zemi.

Bohužel nebylo možné ověřit přesnost těchto odhadů, protože nikdo nikdy neposkytl odhady pro takové malé geografické oblasti ve Rwandě. Ale když Blumenstock a kolegové shrnuli své odhady do 30 okresů Rwandy, zjistili, že jejich odhady jsou velmi podobné odhadům z Demografického a zdravotního průzkumu, který je obecně považován za zlatý standard průzkumů v rozvojových zemích. Ačkoli tyto dva přístupy vedly k podobným odhadům v tomto případě, přístup Blumenstocku a kolegů byl asi desetkrát rychlejší a 50krát levnější než tradiční demografické a zdravotní průzkumy. Tyto dramaticky rychlejší a nižší odhady nákladů vytvářejí nové možnosti pro výzkumníky, vlády a firmy (Blumenstock, Cadamuro, and On 2015) .

Tato studie je něco jako test Rorschach inkblot: to, co lidé vidí, závisí na jejich pozadí. Mnoho sociálních věd vidí nový měřicí nástroj, který lze použít k testování teorií o ekonomickém vývoji. Mnoho vědců v oblasti dat vidí nový studený problém se strojním učením. Mnoho podnikatelů vidí silný přístup k odemčení hodnoty ve velkých datech, které již shromáždili. Mnoho obhájců ochrany soukromí vidí děsivou připomínku, že žijeme v době hromadného dozoru. A nakonec mnoho tvůrců politik vidí způsob, jakým nová technologie může pomoci vytvořit lepší svět. Ve skutečnosti je tato studie všechno, a protože má tento mix vlastností, vidím to jako okno do budoucnosti sociálního výzkumu.