1.1 plama atramentu

Latem 2009 roku telefony komórkowe dzwoniły w całej Rwandzie. Oprócz milionów telefonów od rodziny, przyjaciół i partnerów biznesowych około 1000 Rwandyjczyków otrzymało telefon od Joshua Blumenstock i jego współpracowników. Badacze ci badali bogactwo i ubóstwo, przeprowadzając badanie losowej próbki osób z bazy danych zawierającej 1,5 miliona klientów największego operatora telefonii komórkowej w Rwandzie. Blumenstock i jego koledzy zapytali losowo wybranych osób, czy chcą wziąć udział w ankiecie, wyjaśnili im charakter badań, a następnie zadali szereg pytań dotyczących ich cech demograficznych, społecznych i ekonomicznych.

Wszystko, co do tej pory powiedziałem, brzmi jak tradycyjne badanie opinii społecznej. Ale to, co nadejdzie, nie jest tradycyjne - przynajmniej jeszcze nie. Oprócz danych z badań, Blumenstock i współpracownicy mieli również kompletne zapisy połączeń dla wszystkich 1,5 miliona osób. Łącząc te dwa źródła danych, wykorzystali dane z ankiety, aby wyszkolić model uczenia maszynowego w celu przewidywania majątku danej osoby na podstawie zapisów połączeń. Następnie wykorzystali ten model do oszacowania bogactwa wszystkich 1,5 miliona klientów w bazie danych. Ocenili również miejsca zamieszkania wszystkich 1,5 miliona klientów, wykorzystując informacje geograficzne zawarte w rejestrach połączeń. Łącząc to wszystko - szacowane bogactwo i szacunkowe miejsce zamieszkania - byli w stanie sporządzić wysokiej rozdzielczości mapy rozmieszczenia geograficznego bogactwa w Rwandzie. W szczególności mogliby uzyskać szacunkowe bogactwo dla każdej z 2417 komórek Rwandy, najmniejszej jednostki administracyjnej w kraju.

Niestety, nie można było potwierdzić dokładności tych szacunków, ponieważ nikt nigdy nie przedstawił danych szacunkowych dla tak małych obszarów geograficznych w Rwandzie. Ale kiedy Blumenstock i współpracownicy zsumowali swoje szacunki z 30 dzielnicami Rwandy, stwierdzili, że ich szacunki są bardzo podobne do szacunków z badania demograficznego i zdrowotnego, które jest powszechnie uważane za złoty standard ankiet w krajach rozwijających się. Chociaż te dwa podejścia dały podobne oszacowania w tym przypadku, podejście Blumenstock i współpracowników było około 10 razy szybsze i 50 razy tańsze niż tradycyjne badania demograficzne i zdrowotne. Te znacznie szybsze i tańsze szacunki dają nowe możliwości badaczom, rządom i firmom (Blumenstock, Cadamuro, and On 2015) .

To badanie przypomina test kleksowy Rorschach: to, co ludzie widzą, zależy od ich pochodzenia. Wielu naukowców społecznych dostrzega nowe narzędzie pomiarowe, które można wykorzystać do testowania teorii dotyczących rozwoju gospodarczego. Wielu naukowców zajmujących się danymi dostrzega nowy problem z uczeniem maszynowym. Wielu ludzi biznesu dostrzega potężne podejście do odblokowywania wartości zgromadzonych dużych danych. Wielu zwolenników ochrony prywatności widzi przerażające przypomnienie, że żyjemy w czasie masowej inwigilacji. I wreszcie, wielu decydentów dostrzega sposób, w jaki nowa technologia może pomóc w stworzeniu lepszego świata. W rzeczywistości to badanie dotyczy wszystkich tych rzeczy, a ponieważ ma tę mieszankę cech, uważam to za okno na przyszłość badań społecznych.