1.1 plama atramentu

W lecie 2009 roku, telefony dzwoniły całej Rwandzie. Oprócz milionów połączeń między rodziną, przyjaciółmi i współpracownikami, około 1000 Ruandańczyków otrzymałem telefon od Joshua Blumenstock i jego współpracowników. Naukowcy badali bogactwo i ubóstwo, przeprowadzając ankietę wśród ludzi, którzy zostali losowo z bazy danych 1,5 mln klientów z największym Rwandy operatora telefonii komórkowej. Blumenstock i współpracownicy poprosili uczestników, czy chcą wziąć udział w badaniu, wyjaśnił charakter badań do nich, a następnie zadano szereg pytań o ich cech demograficznych, społecznych i gospodarczych.

Wszystko, co powiedziałem do tej pory sprawia, że ​​to brzmi jak tradycyjne badania w naukach społecznych. Ale, co będzie dalej, nie jest tradycyjny, przynajmniej jeszcze nie teraz. Użyli danych pomiarowych trenować model uczenia maszynowego do przewidzenia czyjegoś bogactwa z ich danymi połączeń, a następnie użyli tego modelu do oszacowania bogactwa wszystkich 1,5 mln klientów. Następnie oszacowali miejsce zamieszkania wszystkich 1,5 mln klientów, korzystając z informacji geograficznej osadzony w dziennikach połączeń. Umieszczenie tych dwóch oszacowań wraz-szacowana bogactwa i szacuje miejsce zamieszkania-Blumenstock i jego współpracownicy byli w stanie przedstawić szacunki wysokiej rozdzielczości geograficznego rozkładu bogactwa całej Rwandzie. W szczególności mogą one wywoływać szacowany bogactwo dla każdego z 2,148 komórek Rwandy, najmniejszą jednostką administracyjną w kraju.

Nie można było zweryfikować te szacunki, bo nikt nigdy nie produkowane szacunki dla takich małych obszarów geograficznych w Rwandzie. Jednak, gdy Blumenstock i współpracownicy agregowane swoje szacunki do Rwandy w 30 okręgach, okazało się, że ich szacunki były zbliżone do szacunków demograficznych i Health Survey, złoty standard badań w krajach rozwijających się. Chociaż te dwa podejścia produkowane podobne szacunki w tym przypadku podejście Blumenstock i współpracowników był około 10 razy szybciej i 50 razy tańsze niż tradycyjne Surveys demograficzną i zdrowotną. Te znacznie szybsze i niższe szacunki kosztów tworzenia nowych możliwości dla naukowców, rządów i firm (Blumenstock, Cadamuro, and On 2015) .

Oprócz opracowania nowej metodologii, badanie to jest coś w rodzaju testu Inkblot Rorschacha; co ludzie widzą, zależy od ich pochodzenia. Wielu naukowców społecznych zobaczyć nowe narzędzie pomiarowe, które mogą być używane do testowania teorie na temat rozwoju gospodarczego. Wielu naukowców danych zobaczyć fajny nowy problem uczenia maszynowego. Wielu ludzi biznesu postrzegają potężne podejście do pozbycia wartość w cyfrowych danych śledzenia, że już zebrane. Wielu zwolenników prywatności zobaczyć przerażające przypomnienie, że żyjemy w czasach masowej kontroli. Wielu decydentów zobaczyć sposób, że nowa technologia może pomóc stworzyć lepszy świat. W rzeczywistości, badanie to jest wszystko z tych rzeczy, a to dlatego, że jest to okno w przyszłość badań społecznych.