2.5 Concluzie

date de mare este peste tot, dar folosindu-l si alte forme de date de observație pentru cercetarea socială este dificilă. În experiența mea există ceva de genul un prânz gratuit nici o proprietate pentru cercetare: dacă nu pune într - o mulțime de colectare a datelor de lucru, atunci probabil va trebui să pună într - o mulțime de muncă analizează datele sau în gândire despre ceea ce este într-o întrebare interesantă de a cere datelor. Bazat pe ideile din acest capitol, cred că există trei căi principale prin care sursele de date mari vor fi cele mai valoroase pentru cercetarea socială:

  • empiric între pronunțându prezicerile teoretice concurente. Exemple de acest tip de activitate includ Farber (2015) (șoferi de taxi din New York) și King, Pan, and Roberts (2013) (Cenzură în China)
  • măsurare socială îmbunătățită pentru politica prin nowcasting. Un exemplu de acest tip de muncă este Ginsberg et al. (2009) (Google Tendințele gripei).
  • estimarea efectelor cauzale cu experimente naturale și de potrivire. Exemple de acest tip de muncă. Mas and Moretti (2009) (peer efecte asupra productivității) și Einav et al. (2015) (efectul prețului de pornire la licitațiile la eBay).

Multe întrebări importante în cercetarea socială ar putea fi exprimate ca una dintre aceste trei. Cu toate acestea, aceste abordări necesită, în general, cercetători pentru a aduce o mulțime de date. Ceea ce face ca Farber (2015) interesantă este motivația teoretică pentru măsurarea. Această motivație teoretică provine din afara datelor. Astfel, pentru cei care sunt buni la cer anumite tipuri de întrebări de cercetare, surse mari de date pot fi foarte fructuoasă.

În cele din urmă, mai degrabă decât teoria bazate pe cercetări empirice (care a fost punctul central de pe acest capitol), putem flip script - ul și de a crea teoretizarea empiric-condus. Aceasta este, prin acumularea atentă a faptelor empirice, modele, și puzzle-uri, putem construi noi teorii.

Această alternativă, abordare a datelor în primul rând la teorie nu este nouă, și a fost articulat cel mai mult de forțat Glaser and Strauss (1967) cu apelul lor pentru teoria întemeiată. Această abordare de date în primul rând, cu toate acestea, nu implică "sfârșitul teoriei" , așa cum a fost revendicat de o mare parte a jurnalismului în jurul cercetării în era digitală (Anderson 2008) , (Anderson 2008) . Mai degrabă, ca schimbările mediului de date, trebuie să ne așteptăm la o re-echilibrare în relația dintre teorie și date. Într-o lume în care colectarea de date a fost costisitoare, are sens să colecteze numai datele care sugerează teoriile vor fi cel mai util. Dar într - o lume în care cantități enorme de date sunt deja disponibile gratuit, are sens pentru a încerca , de asemenea , o abordare de date mai întâi (Goldberg 2015) .

Așa cum am arătat în acest capitol, cercetatorii pot învăța o mulțime de vizionarea oameni. În următoarele trei capitole, voi descrie modul în care putem învăța mai multe și diferite lucruri, dacă ne adaptăm colecția noastră de date și de a interacționa cu oamenii mai direct punându-le întrebări (Capitolul 3), experimentele de funcționare (capitolul 4), și chiar și implicarea acestora în procesul de cercetare direct (Capitolul 5).