2.5 Slutsats

Big data överallt, men att använda det och andra former av observationsdata för social forskning är svårt. Enligt min erfarenhet finns det något som en ingen fri lunch fastighet för forskning: om du inte lägger i en hel del arbete att samla in data, då är du antagligen kommer att behöva sätta i en hel del arbete att analysera dina data eller att tänka på vad som finns i en intressant fråga att ställa om data. Baserat på de idéer i detta kapitel, jag tror att det finns tre huvudsakliga sätt att stora datakällor kommer att vara mest värdefulla för social forskning:

empiriskt dömer mellan konkurrerande teoretiska förutsägelser. Exempel på denna typ av arbete är Farber (2015) (New York Taxichaufförer) och King, Pan, and Roberts (2013) (Censur i Kina)
förbättrad social mätning för politik genom Nowcasting. Ett exempel på denna typ av arbete är Ginsberg et al. (2009) (Google Flu Trends).
skatta kausala effekter med naturliga experiment och matchning. Exempel på denna typ av arbete. Mas and Moretti (2009) (peer-effekter på produktiviteten) och Einav et al. (2015) (effekt av utgångspriset på auktion på eBay).

Många viktiga frågor i samhällsforskningen kan uttryckas som en av dessa tre. Men dessa metoder kräver i allmänhet forskare för att få en hel del till data. Vad gör Farber (2015) intressant är den teoretiska motivation för mätningen. Denna teoretiska motivation kommer från utanför data. Således, för dem som är duktiga på att ställa vissa typer av forskningsfrågor, kan stora datakällor vara mycket givande.

Slutligen, snarare än teoridriven empirisk forskning (som har varit i fokus på detta kapitel), kan vi vända skriptet och skapa empiriskt driven teoretiserande. Det vill säga, genom noggrann ansamling av empiriska fakta, mönster och pussel, vi kan bygga nya teorier.

Detta alternativ, data första inställning till teorin är inte ny, och det var mest kraftfullt artikuleras av Glaser and Strauss (1967) med sin uppmaning till grounded theory. Denna data första tillvägagångssätt är emellertid inte innebära "i slutet av teorin", som har hävdats av stora delar av journalistik kring forskning i den digitala eran (Anderson 2008) . Snarare, eftersom ändringarna datamiljö, måste vi räkna med en omfördelning i relationen mellan teori och data. I en värld där datainsamlingen var dyr, är det vettigt att bara samla in data som teorierna föreslår kommer att vara den mest användbara. Men i en värld där enorma mängder data finns redan tillgängliga för gratis, är det vettigt att också prova en data första metoden (Goldberg 2015) .

Som jag har visat i det här kapitlet, kan forskare lära sig mycket genom att titta på folk. Under de kommande tre kapitlen, kommer jag att beskriva hur vi kan lära mer och olika saker om vi skräddarsyr vår datainsamling och interagera med människor mer direkt genom att ställa frågor till dem (kapitel 3), kör experiment (kapitel 4), och även involvera dem i forskningsprocessen direkt (kapitel 5).