2.5 Conclusão

Big data está em toda parte, mas usá-lo e outras formas de dados observacionais para a pesquisa social é difícil. Na minha experiência, há algo como um nenhuma propriedade almoço grátis para a investigação: se você não colocar em um monte de trabalho a coleta de dados, então você provavelmente vai ter que colocar em um monte de trabalho analisando seus dados ou no pensamento sobre o que está em uma pergunta interessante para perguntar dos dados. Com base nas idéias neste capítulo, eu acho que existem três principais formas que as fontes de dados grandes serão mais valioso para a investigação social:

  • empiricamente decidindo entre concorrentes previsões teóricas. Exemplos deste tipo de trabalho incluem Farber (2015) (motoristas de táxi de Nova York) e King, Pan, and Roberts (2013) (A censura na China)
  • aperfeiçoamento da medição social para a política através de previsão imediata. Um exemplo deste tipo de trabalho é Ginsberg et al. (2009) (Google Flu Trends).
  • estimar os efeitos causais com experimentos naturais e combinando. Exemplos deste tipo de trabalho. Mas and Moretti (2009) (peer efeitos sobre a produtividade) e Einav et al. (2015) (efeito do preço inicial em leilões no eBay).

Muitas questões importantes na pesquisa social pode ser expressa como um desses três. No entanto, estas abordagens requerem geralmente investigadores para trazer uma grande quantidade de dados. O que torna Farber (2015) interessante é a motivação teórica para a medição. Esta motivação teórica vem de fora os dados. Assim, para aqueles que são bons na cotação de certos tipos de questões de pesquisa, fontes de dados grandes pode ser muito proveitosa.

Finalmente, em vez de teoria-driven pesquisa empírica (que tem sido o foco neste capítulo), que pode virar o script e criar teorias empiricamente-driven. Ou seja, através da acumulação cuidadosa dos fatos empíricos, padrões e quebra-cabeças, podemos construir novas teorias.

Esta abordagem alternativa, os dados-primeiro a teoria não é nova, e foi mais fortemente articulada por Glaser and Strauss (1967) , com sua chamada para a teoria fundamentada. Esta abordagem de dados em primeiro lugar, no entanto, não implica "o fim da teoria", como tem sido afirmado por grande parte do jornalismo em torno da investigação na era digital (Anderson 2008) . Pelo contrário, como as mudanças no ambiente de dados, devemos esperar um reequilíbrio na relação entre teoria e dados. Em um mundo onde a coleta de dados foi caros, faz sentido para recolher apenas os dados que teorias sugerem será o mais útil. Mas, em um mundo onde enormes quantidades de dados já estão disponíveis gratuitamente, faz sentido para também tentar uma abordagem de dados em primeiro (Goldberg 2015) .

Como já mostrado neste capítulo, os pesquisadores podem aprender muito observando as pessoas. Nos próximos três capítulos, vou descrever como podemos aprender mais e diferentes coisas se adaptar a nossa coleta de dados e interagir com as pessoas mais diretamente, pedindo-lhes perguntas (Capítulo 3), executando experimentos (Capítulo 4), e até mesmo envolvendo-os no processo de pesquisa diretamente (Capítulo 5).