2.5 Wnioski

Big danych jest wszędzie, ale używając go oraz innych form danych obserwacyjnych dla badań społecznych jest trudne. Z mojego doświadczenia wynika, że jest coś jakby bez wolnego własności obiad dla badań: jeśli nie włożyć wiele pracy, zbieranie danych, to prawdopodobnie będzie musiał włożyć wiele pracy analizującego dane lub w myśleniu o co jest w ciekawym pytaniem danych. Opierając się na idei zawartych w niniejszym rozdziale, myślę, że istnieją trzy główne sposoby, że duże źródła danych będzie najbardziej cenne dla badań społecznych:

  • empirycznie orzekania między konkurującymi przewidywań teoretycznych. Przykłady tego rodzaju pracy obejmują Farber (2015) (kierowcy New York Taxi) oraz King, Pan, and Roberts (2013) (cenzura w Chinach)
  • ulepszony pomiar za politykę społeczną poprzez krótkoterminowego prognozowania. Przykładem tego rodzaju pracy jest Ginsberg et al. (2009) (Google Flu Trends).
  • szacowania skutków przyczynowych z naturalnych eksperymentów i dopasowywania. Przykłady tego rodzaju pracy. Mas and Moretti (2009) (peer wpływ na wydajność) oraz Einav et al. (2015) (efekt cena wywoławcza na aukcji na eBay).

Wiele ważnych pytań w badaniach społecznych może być wyrażona jako jedno z tych trzech. Jednak takie podejście wymaga na ogół badaczy przynieść wiele danych. Co sprawia, że Farber (2015) interesująca jest teoretyczna motywacja do pomiaru. Ten teoretyczny motywacja pochodzi spoza danych. Tak więc, dla tych, którzy są dobrzy w pytając pewne rodzaje pytań badawczych, duże źródła danych mogą być bardzo owocne.

Wreszcie, zamiast teorii opartych na badaniach empirycznych (które było skupienie się na tym rozdziale), możemy odwrócić scenariusz i stworzyć empirycznie napędzany teoretyzowania. Oznacza to, że dzięki starannemu nagromadzenie faktów empirycznych, wzorów i zagadek, możemy zbudować nowe teorie.

Ta alternatywa, danych, pierwsze podejście do teorii nie jest nowy, i to było najbardziej dobitnie sformułowane przez Glaser and Strauss (1967) z ich zaproszenia do teorii ugruntowanej. Podejście pierwsze danych, jednak nie oznacza "koniec teorii", jak została odebrana przez wiele dziennikarstwa wokół badań w erze cyfrowej (Anderson 2008) . Raczej, jak zmiany środowiska danych, musimy spodziewać się przywróceniu równowagi w stosunkach między teorią i danych. W świecie, w którym gromadzone są dane było drogie, to ma sens tylko do zbierania danych, które teorie sugerują będzie najbardziej przydatna. Ale w świecie, w którym ogromne ilości danych są już dostępne za darmo, warto też spróbować podejścia danych pierwszego (Goldberg 2015) .

Jak wykazano w niniejszym rozdziale, naukowcy mogą się wiele nauczyć, obserwując ludzi. W kolejnych trzech rozdziałach opiszę w jaki sposób możemy dowiedzieć się więcej i różne rzeczy, jeśli dostosować nasze zbiory danych i interakcji z ludźmi w bardziej bezpośredni sposób, zadając im pytania (rozdział 3), prowadzenie eksperymentów (rozdział 4), a nawet z ich udziałem w procesie badawczym bezpośrednio (Rozdział 5).