2.5 Conclusión

Big data está en todas partes, pero usalo e outras formas de datos astronómicos para a investigación social é difícil. Na miña experiencia, hai algo así como un ningunha propiedade xantar de balde para a investigación: se non poñer en unha morea de traballo a obtención de datos, entón probablemente vai ter que poñer en unha morea de traballo analizando os seus datos ou no pensamento sobre o que está en unha pregunta interesante para preguntar dos datos. Baseado nas ideas neste capítulo, creo que hai tres principais formas que as fontes de datos grandes serán máis valioso para a investigación social:

  • empiricamente decidindo entre competidores previsións teóricas. Exemplos deste tipo de traballo inclúen Farber (2015) (condutores de taxi de Nova York) e King, Pan, and Roberts (2013) (A censura en China)
  • perfeccionamento da medición social á política a través de previsión inmediata. Un exemplo deste tipo de traballo é Ginsberg et al. (2009) (Google Flu Trends).
  • estimar os efectos causais con experimentos naturais e combinando. Exemplos deste tipo de traballo. Mas and Moretti (2009) (peer efectos sobre a produtividade) e Einav et al. (2015) (efectos do prezo inicial en poxas en eBay).

Moitas cuestións importantes na investigación social pode ser expresada como unha destas tres. Con todo, estas formulacións requiren xeralmente investigadores para levar unha gran cantidade de datos. O que fai Farber (2015) interesante é a motivación teórica para a medición. Esta motivación teórica vén de fóra os datos. Así, para os que son bos na cotización de certos tipos de cuestións de investigación, fontes de datos grandes pode ser moi proveitosa.

Finalmente, no canto de teoría-driven pescuda empírica (que foi o foco neste capítulo), que pode virar a escritura e crear teorías empiricamente-driven. É dicir, a través da acumulación coidadosa dos feitos empíricos, patróns e crebacabezas, podemos construír novas teorías.

Esta visión alternativa, os datos primeiro a teoría non é nova, e foi máis fortemente articulado por Glaser and Strauss (1967) , coa súa chamada á teoría fundamentada. Esta visión de datos en primeiro lugar, con todo, non implica "a fin da teoría", como foi afirmado por gran parte do xornalismo en torno á investigación na era dixital (Anderson 2008) . Pola contra, como os cambios no ámbito de datos, hai que esperar un reequilibrio na relación entre teoría e datos. Nun mundo onde a obtención de datos foi caros, ten sentido para recoller só os datos que teorías suxiren será o máis útil. Pero nun mundo onde enormes cantidades de datos xa están dispoñibles gratuitamente, ten sentido para tamén tentar unha visión de datos en primeiro (Goldberg 2015) .

Como xa se mostra neste capítulo, os investigadores poden aprender moito observando á xente. Nos próximos tres capítulos, vou describir como podemos aprender máis e diferentes cousas adaptarse a nosa recollida de datos e interactuar coas persoas máis directamente, pedíndolles preguntas (capítulo 3), executando experimentos (Capítulo 4), e mesmo que inclúen os no proceso de investigación directamente (Capítulo 5).