3.6.1 Amplified prosząc

Łączenie sondażu śladów cyfrowych może być jak prosi wszystkich Państwa pytania w każdej chwili.

Zadawanie ogół występuje w dwóch głównych kategoriach: badań reprezentacyjnych i spisów. Przykładowe ankiety, gdzie można uzyskać dostęp do niewielkiej liczby osób, mogą być elastyczne, terminowe i stosunkowo tanie. Jednakże badania próbki, ponieważ są one oparte na próbce często ograniczają ich rozmiar; z badania reprezentacyjnego, jest często trudne do dokonania szacunków o konkretnych regionów geograficznych lub określonych grup demograficznych. Spisy, z drugiej strony, próbują przesłuchać wszystkich w populacji. Mają wielkie rozdzielczości, ale zazwyczaj są one drogie, wąski ostrości (one zawierać tylko niewielką liczbę pytań), a nie w odpowiednim czasie (to zdarzyć na ustalonym harmonogramem, na przykład co 10 lat) (Kish 1979) . Teraz wyobraźcie sobie, że naukowcy mogli łączyć w sobie najlepsze cechy badań reprezentacyjnych i spisów; wyobraźcie sobie, że naukowcy mogliby zadać każde pytanie wszystkim na co dzień.

Oczywiście, to ciągłe, wszechobecne, zawsze na badaniu jest rodzajem nauki społecznej fantazji. Ale wydaje się, że możemy zacząć zbliżenie tego łącząc pytania ankietowe z małej liczby osób śladów cyfrowych z wielu ludzi. Nazywam ten typ kombinacji wzmacniany pytania. Jeśli zostanie to zrobione dobrze, to może pomóc nam zapewnia szacują, że są bardziej lokalnym (dla mniejszych obszarów geograficznych), bardziej ziarnisty (dla konkretnych grup demograficznych) oraz bardziej aktualne.

Jednym z przykładów powielanego wywoławczą pochodzi z pracy Joshua Blumenstock, który chciał zebrać dane, które pomogłyby rozwój prowadzący w biednych krajach. Dokładniej, Blumenstock chciał stworzyć system do pomiaru bogactwa i dobrobytu, które w połączeniu kompletność spisu z elastycznością i częstotliwości badań (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . W rzeczywistości, jak już opisano pracę Blumenstock za krótko w rozdziale 1.

Aby rozpocząć, Blumenstock partnerem największego operatora telefonii komórkowej w Rwandzie. Firma przedstawiła mu anonimowych zapisów transakcji z około 1,5 mln klientów, obejmujących zachowanie od 2005 i 2009. Dzienniki zawierają informacje na temat każdego połączenia i wiadomości tekstowe, takie jak czas rozpoczęcia, czas trwania i przybliżonej lokalizacji geograficznej rozmówcy i odbiornikiem. Zanim zaczniemy mówić o kwestiach statystycznych, warto zwrócić uwagę, że ten pierwszy krok może być jednym z najtrudniejszych. Jak opisano w rozdziale 2, większość cyfrowych danych śledzenia jest niedostępne dla badaczy. I wiele firm są uzasadnione niechętne dzielić się swoimi danymi, ponieważ jest prywatny; to ich klienci zapewne nie spodziewał się, że ich zapisy będą udostępniane-luzem, z badaczami. W tym przypadku, naukowcy wzięli ostrożne kroki, aby utajnianie danych, a ich praca była nadzorowana przez osoby trzecie (tj ich IRB). Ale pomimo tych wysiłków, dane te są prawdopodobnie nadal rozpoznawalne i może zawierać poufne informacje (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Wrócę do tych kwestii etycznych w rozdziale 6.

Przypomnijmy, że Blumenstock był zainteresowany mierzenia dobrobytu i dobrego samopoczucia. Ale te cechy nie są bezpośrednio do rejestrów połączeń. Innymi słowy, te rekordy połączeń są niekompletne do tego badania, wspólną cechą śladów cyfrowych, które zostały szczegółowo omówione w rozdziale 2. Ale, wydaje się prawdopodobne, że zapisy rozmów prawdopodobnie masz jakieś informacje na temat bogactwa i dobrobytu. Dlatego jednym ze sposobów zadawania zapytania Blumenstock mogłoby być: czy jest to możliwe do przewidzenia, jak ktoś odpowie na badania na podstawie ich cyfrowych danych śledzenia? Jeśli tak, to zadając kilka osób możemy odgadnąć odpowiedź na każdy inny.

Aby to ocenić empirycznie Blumenstock i badawcze asystenci z Kigali Instytutu Nauki i Technologii nazywa próbkę około tysiąca klientów telefonii komórkowej. Naukowcy wyjaśniają cele projektu uczestnikom, poprosił o zgodę na łączenie odpowiedzi ankietowych do zapisów połączeń, a następnie zadał im serię pytań w celu określenia ich bogactwo i dobrobyt, takie jak "Czy jesteś właścicielem radio? "i" Czy jesteś właścicielem rower? "(patrz rysunek 3.11 do częściowego listy). Wszyscy uczestnicy badania były rekompensowane finansowo.

Następnie Blumenstock stosowane procedury dwuetapowej wspólnej nauki danych: Konstrukcja funkcji następuje nadzorowanego uczenia się. Po pierwsze, w etapie inżynierii cechą, dla każdego, który został przeprowadzony, Blumenstock konwertowane zapisy połączeń na zestaw cech temat każdej osoby; Naukowcy dane mogą wywoływać te cechy "funkcje" i socjologowie byłoby je nazwać "zmienne". Na przykład, dla każdej osoby, Blumenstock oblicza łączną liczbę dni z działalności, liczba różnych ludzi osoba była w kontakcie z, kwota pieniądze wydane na czas antenowy, i tak dalej. Krytycznie, dobra technika funkcja wymaga wiedzy o środowisku badawczym. Na przykład, jeśli jest to ważne, aby rozróżniać połączeń krajowych i międzynarodowych (możemy oczekiwać, że ludzie, którzy nazywają się bogatsi międzynarodowym), to należy to zrobić na etapie inżynierii cechą. Badacz z niewielkim zrozumieniem Rwandzie może nie należą do tej funkcji, a następnie predykcyjna Wyniki modelu będzie cierpieć.

Następnie w nadzorowanym czynności uczenia się, Blumenstock wbudowany model statystyczny przewidzieć Response dla każdej osoby na podstawie ich właściwości. W tym przypadku, Blumenstock używane regresji logistycznej z 10-krotnego sprawdzianu krzyżowego, ale mógłby stosowane wiele innych metod uczenia statystycznego lub maszynowo.

Więc jak również nie działa? Czy Blumenstock stanie przewidzieć odpowiedź do badania pytania typu "Czy jesteś właścicielem radia?" I "Czy jesteś właścicielem rower?" Korzystanie z funkcji pochodzących z rejestrów połączeń? Raczej. Dokładność prognoz były wysokie dla niektórych cech (rysunek 3.11). Ale to jest zawsze ważne, aby porównać kompleksową metodę przewidywania przed prostą alternatywę. W tym przypadku, Prostą alternatywą jest przewidzieć, że każdy daje najczęściej odpowiedź. Na przykład 97,3% potwierdziło posiadanie radia więc jeśli Blumenstock nie przewidział, że każdy by zgłosić posiadanie radia miałby dokładność 97,3%, co jest zaskakująco podobna do pełnionej bardziej skomplikowanej procedury (dokładność 97,6%). Innymi słowy, wszystkie wyszukane dane i modelowanie zwiększyć dokładność przewidywania od 97,3% do 97,6%. Jednakże w odniesieniu do innych kwestii, takich jak: "Czy jesteś właścicielem rower?", Przewidywania poprawił się z 54,4% do 67,6%. Mówiąc bardziej ogólnie, Rysunek 3.12 pokazuje niektórych cech Blumenstock nie poprawiło znacznie poza to co proste bazowego prognozy, ale dla innych cech była pewna poprawa.

Rysunek 3.11: Predictive dokładność modelu statystycznego trenował z rejestrów połączeń. Wyniki przedstawione w tabeli 2 Blumenstock (2014).

Rysunek 3.11: Predictive dokładność modelu statystycznego trenował z rejestrów połączeń. Wyniki przedstawione w tabeli 2 Blumenstock (2014) .

Rysunek 3.12: Porównanie dokładności predykcyjnej dla modelu statystycznego trenował z zapisów wezwanie do prostego prognozowania bazowym. Punkty są lekko jittered celu uniknięcia nakładania się; patrz tabela 2 Blumenstock (2014) dla dokładnej wartości.

Rysunek 3.12: Porównanie dokładności predykcyjnej dla modelu statystycznego trenował z zapisów wezwanie do prostego prognozowania bazowym. Punkty są lekko jittered celu uniknięcia nakładania się; patrz tabela 2 Blumenstock (2014) dla dokładnej wartości.

W tym momencie można pomyśleć, że te wyniki są nieco rozczarowujące, ale tylko jeden rok później Blumenstock i dwóch kolegów-Gabriel Cadamuro i Robert On-opublikował papieru w Nauce ze znacznie lepszymi wynikami (Blumenstock, Cadamuro, and On 2015) , Były dwa główne powody techniczne dla poprawy: 1) są używane bardziej wyrafinowanych metod (czyli nowe podejście do funkcji inżynierskich i bardziej wyrafinowanego modelu uczenia maszynowego) i 2), a nie próbując wywnioskować odpowiedzi na poszczególne pytania ankiety (np "Czy jesteś właścicielem radio?"), starali się wywnioskować złożony wskaźnik bogactwa.

Blumenstock i współpracownicy wykazała wydajność podejściu na dwa sposoby. Po pierwsze, okazało się, że dla ludzi w ich próbki, mogliby zrobić bardzo dobrą pracę przewidywania ich bogactwa z rejestrów połączeń (rysunek 3.14). Po drugie, coraz ważniejsze, Blumenstock wraz ze współpracownikami wykazał, że ich postępowanie może produkować wysokiej jakości szacunki dotyczące geograficznego rozkładu bogactwa w Rwandzie. Dokładniej, używali ich modelu uczenia maszynowego, który został przeszkolony w ich próbie około 1000 osób, do przewidzenia bogactwo wszystkich 1,5 mln osób w rejestrach połączeń. Ponadto, z geoprzestrzennych danych zawartych w danych telefonicznych (przypomnijmy, że dane wywołanie zawiera lokalizację najbliższej wieży komórkowej dla każdego połączenia), naukowcy byli w stanie oszacować przybliżone miejsce zamieszkania każdej osoby. Umieszczenie tych dwóch oszacowań razem, badania produkowane oszacowanie rozkładu geograficznego bogactwa abonenckiej przy bardzo drobnym uziarnieniu przestrzennej. Na przykład, mogą oszacować średnią bogactwa w każdej z 2148 komórek Rwandy (najmniejsza jednostka administracyjna w kraju). Te przewidywane wartości majątkowe były tak granulowany były one trudne do sprawdzenia. Więc naukowcy agregowane ich wyników do przedstawienia szacunków średniej zamożności Rwandy w 30 okręgach. Te szacunki powiat szczebla były silnie związane z szacunkami ze standardowego badania tradycyjnego złota w Rwandzie demograficzne i Health Survey (rysunek 3.14). Chociaż szacunki z dwóch źródeł były podobne szacunki z Blumenstock i kolegów były około 50 razy tańszy i 10 razy szybciej (gdy koszty w mierzonych w kategoriach kosztów zmiennych). Ten dramatyczny spadek kosztów oznacza, że ​​zamiast być kursują co kilka lat, podobnie jak standard demograficzną i zdrowotną Surveys-hybryda małego badania w połączeniu z dużymi śladowych danych cyfrowych może być uruchamiany co miesiąc.

Rysunek 3.13: Schemat Blumenstock, Cadamuro i On (2015). Transmisja danych od operatora telefonicznego został przerobiony na osnowie z jednym rzędem dla każdej osoby i jedną kolumnę dla każdej funkcji (czyli zmienna). Następnie naukowcy zbudowali nadzorowanego uczenia modelu do przewidywania odpowiedzi ankietowych od osoby od matrycy funkcji. Następnie nadzorowany modelu uczenia wykorzystano do przypisania odpowiedzi ankietowych dla każdego. W istocie, naukowcy wykorzystali reakcje około tysiąca osób przypisać bogactwo około miliona ludzi. Ponadto, naukowcy oszacowali przybliżonego miejsca zamieszkania dla wszystkich 1,5 mln osób na podstawie miejscach ich połączeń. Gdy obie te szacunki zostały połączone-szacowana bogactwo i szacowane miejsce rezydencji wyniki były zbliżone do szacunków demograficznych i Health Survey, tradycyjnym badaniu złotym standardem (rysunek 3.14).

Rysunek 3.13: Schemat Blumenstock, Cadamuro, and On (2015) . Transmisja danych od operatora telefonicznego został przerobiony na osnowie z jednym rzędem dla każdej osoby i jedną kolumnę dla każdej funkcji (czyli zmienna). Następnie naukowcy zbudowali nadzorowanego uczenia modelu do przewidywania odpowiedzi ankietowych od osoby od matrycy funkcji. Następnie nadzorowany modelu uczenia wykorzystano do przypisania odpowiedzi ankietowych dla każdego. W istocie, naukowcy wykorzystali reakcje około tysiąca osób przypisać bogactwo około miliona ludzi. Ponadto, naukowcy oszacowali przybliżonego miejsca zamieszkania dla wszystkich 1,5 mln osób na podstawie miejscach ich połączeń. Gdy obie te szacunki zostały połączone-szacowana bogactwo i szacowane miejsce rezydencji wyniki były zbliżone do szacunków demograficznych i Health Survey, tradycyjnym badaniu złotym standardem (rysunek 3.14).

Rysunek 3.14: Wyniki z Blumenstock, Cadamuro, a na (2015). Na poziomie indywidualnym, naukowcy byli w stanie zrobić rozsądną pracę w przewidywaniu czyjegoś bogactwa ze swoich rejestrów połączeń. Szacunki powiat poziomu bogactwa, które zostały oparte na szacunkach indywidualnego poziomu bogactwa i miejsce zamieszkania-wyniki były zbliżone do wyników z demograficzne i Health Survey, tradycyjnym badaniu złotym standardem.

Rysunek 3.14: Wyniki z Blumenstock, Cadamuro, and On (2015) . Na poziomie indywidualnym, naukowcy byli w stanie zrobić rozsądną pracę w przewidywaniu czyjegoś bogactwa ze swoich rejestrów połączeń. Szacunki powiat poziomu bogactwa, które zostały oparte na szacunkach indywidualnego poziomu bogactwa i miejsce zamieszkania-wyniki były zbliżone do wyników z demograficzne i Health Survey, tradycyjnym badaniu złotym standardem.

Podsumowując, Blumenstock na namnożony prosząc podejście połączone dane z badań z danymi śledzenia cyfrowych do przedstawienia szacunków porównywalne z szacunkami ankietowych złoty standard. Ten szczególny przykład wyjaśnia również niektóre kompromisy pomiędzy powielanego wywoławczą i tradycyjnych metod pomiarowych. Po pierwsze, powielone szacunki wywoławcze były bardziej aktualne, znacznie tańsze i bardziej szczegółowe. Jednak z drugiej strony, w tym czasie nie jest silnym teoretyczne podstawy takiej wzmocnionego zadaje. Oznacza to, że ten przykład nie pokazuje, kiedy to będzie działać, a kiedy nie. Ponadto wzmocniony podejście wywoławcza nie ma jeszcze dobrych sposobów do ilościowego niepewności wokół swoich szacunków. Jednak wzmacniany wywoławcza ma głębokie połączenia do trzech dużych obszarów w statystykach, w oparciu o model post-stratyfikacji (Little 1993) , przypisywania (Rubin 2004) oraz szacowania małych obszarów (Rao and Molina 2015) -i więc oczekiwać, że postęp będzie być szybki.

Wzmacniany wywoławcza następujący podstawowy przepis, który może być dostosowany do konkretnej sytuacji. Istnieją dwa składniki i dwóch etapach. Te dwa składniki są 1) cyfrowy ślad zbiór danych, który jest szeroki, ale cienkie (to znaczy, że jest wielu ludzi, ale nie informacje, które trzeba o siebie osoby) i 2) badania, które są wąskie, ale gruba (to znaczy, że ma tylko kilka osób, ale ma informacje, że trzeba o tych osób). Następnie, istnieją dwa etapy. Po pierwsze, dla ludzi w obu źródłach danych, zbudować model uczenia maszynowego, który wykorzystuje dane śledzenia cyfrowych do przewidzenia odpowiedzi ankietowych. Następnie za pomocą tego modelu uczenia maszynowego przypisać odpowiedź Badanie wszyscy w śladowych danych cyfrowych. Tak więc, jeśli istnieją pewne pytanie, które chcesz zadać, aby wielu ludzi, szukać śladów cyfrowych danych z tych osób, które mogą być używane do przewidywania ich odpowiedź.

Porównując pierwszą i drugą próbę Blumenstock pod adresem problemu ilustruje również ważną lekcję na temat przejścia z drugiej ery do ery trzecich podejść do badania badania: początek nie jest końcem. Oznacza to, że wiele razy, pierwsze podejście nie będzie najlepszy, ale jeśli naukowcy kontynuowania pracy, co może się lepiej. Mówiąc bardziej ogólnie, podczas oceny nowych metod badań społecznych w epoce cyfrowej, ważne jest, aby dwie różne oceny: 1), jak dobrze to działa teraz i 2), jak dobrze myślisz, że to może działać w przyszłości w krajobrazie danych zmiany i jak naukowcy poświęcają większej uwagi na ten problem. Chociaż naukowcy są szkoleni, aby pierwszy rodzaj oceny (jak dobry jest ten konkretny kawałek badań), drugi jest często ważniejsze.