2.5 Konklusion

Big data er overalt, men bruger det og andre former for observationsdata for social forskning er vanskelig. I min erfaring er der noget som en ingen gratis frokost ejendom til forskning: hvis du ikke sætte i en masse arbejde at indsamle data, så er du sandsynligvis nødt til at sætte i en masse arbejde at analysere dine data eller i tanker om hvad der er i et interessant spørgsmål at stille af dataene. Baseret på de ideer i dette kapitel, tror jeg, at der er tre måder at store datakilder vil være mest værdifulde for social forskning:

  • empirisk træffer afgørelse mellem konkurrerende teoretiske forudsigelser. Eksempler på denne type arbejde omfatter Farber (2015) (New York Taxachauffører) og King, Pan, and Roberts (2013) (Censur i Kina)
  • bedre social måling for politik gennem udarbejdelse af korttidsprognoser. Et eksempel på denne type arbejde er Ginsberg et al. (2009) (Google Flu Trends).
  • estimering kausale effekter med naturlige eksperimenter og matchning. Eksempler på denne type arbejde. Mas and Moretti (2009) (peer effekter på produktiviteten) og Einav et al. (2015) (effekt af startpris på auktion på eBay).

Mange vigtige spørgsmål i social forskning kunne udtrykkes som en af ​​disse tre. Men disse fremgangsmåder kræver generelt, forskerne at bringe en masse til dataene. Hvad gør Farber (2015) interessant er det teoretiske motivation for målingen. Denne teoretiske motivation kommer fra uden for data. Således, for dem der er gode til at spørge visse typer forskningsspørgsmål, kan store datakilder være meget frugtbart.

Endelig, i stedet for teori-drevet empirisk forskning (som har været i fokus på dette kapitel), kan vi vende scriptet og skabe empirisk drevet teoretisering. Det vil sige, gennem omhyggelig ophobning af empiriske fakta, mønstre og gåder, vi kan bygge nye teorier.

Dette alternativ, data-første tilgang til teori er ikke nyt, og det var mest kraftigt formuleret af Glaser and Strauss (1967) med deres krav om grounded theory. Disse data-første fremgangsmåde er imidlertid ikke ensbetydende med "i slutningen af teori", som er blevet hævdet af meget af den journalistik omkring forskning i den digitale tidsalder (Anderson 2008) . Snarere, da data miljø ændres, må vi forvente en re-balancering i forholdet mellem teori og data. I en verden, hvor dataindsamlingen var dyrt, giver det mening at kun indsamle de data, teorier tyder vil være det mest nyttige. Men i en verden, hvor enorme mængder af data allerede til rådighed gratis, giver det mening at også prøve en data-første tilgang (Goldberg 2015) .

Som jeg har vist i dette kapitel, kan forskerne lære en masse ved at se mennesker. I de næste tre kapitler, vil jeg beskrive, hvordan vi kan lære flere og forskellige ting, hvis vi skræddersyr vores dataindsamling og interagere med folk mere direkte ved at stille dem spørgsmål (kapitel 3), der kører eksperimenter (kapitel 4), og endda inddrage dem i forskningsprocessen direkte (kapitel 5).