2.5 Conclusion

Big données est partout, mais l'utiliser et d'autres formes de données d'observation de la recherche sociale est difficile. Dans mon expérience , il y a quelque chose comme un pas de propriété de repas gratuit pour la recherche: si vous ne mettez pas beaucoup de travail de collecte des données, alors vous allez probablement avoir à mettre beaucoup de travail d' analyser vos données ou dans la réflexion sur ce qui est dans une question intéressante à poser des données. Sur la base des idées de ce chapitre, je pense qu'il ya trois façons principales sources de données grandes seront les plus précieux pour la recherche sociale:

statuant empiriquement entre en compétition prédictions théoriques. Des exemples de ce genre de travail comprennent Farber (2015) (pilotes de New York Taxi) et King, Pan, and Roberts (2013) (censure en Chine)
amélioration de la mesure sociale de la politique par le biais des premières estimations. Un exemple de ce genre de travail est Ginsberg et al. (2009) (Google Flu Trends).
l'estimation des effets de causalité avec des expériences naturelles et l'appariement. Des exemples de ce genre de travail. Mas and Moretti (2009) (peer effets sur la productivité) et Einav et al. (2015) (effet du prix de départ sur les ventes aux enchères sur eBay).

De nombreuses questions importantes dans la recherche sociale pourraient être exprimées en un de ces trois. Cependant, ces approches nécessitent généralement des chercheurs d'apporter beaucoup aux données. Ce qui rend Farber (2015) intéressante est la motivation théorique pour la mesure. Cette motivation théorique provient de l'extérieur des données. Ainsi, pour ceux qui sont bons à poser certains types de questions de recherche, sources de données grandes peuvent être très fructueux.

Enfin, plutôt que de la théorie axée sur la recherche empirique (qui a fait l'objet de ce chapitre), nous pouvons retourner le script et créer théorisation empiriquement-driven. Cela est, par l'accumulation minutieuse des faits empiriques, des motifs et des énigmes, nous pouvons construire de nouvelles théories.

Cette alternative approche, des données-première à la théorie est pas nouveau, et il a été le plus fortement articulé par Glaser and Strauss (1967) avec leur appel à la théorie ancrée. Cette approche de données d' abord, cependant, ne signifie pas "la fin de la théorie," comme cela a été revendiqué par une grande partie du journalisme autour de la recherche à l'ère numérique (Anderson 2008) , (Anderson 2008) . Au contraire, comme les changements de l'environnement de données, nous devons nous attendre un rééquilibrage de la relation entre la théorie et les données. Dans un monde où la collecte de données était cher, il est logique de ne recueillir que les données que les théories suggèrent sera le plus utile. Mais, dans un monde où d' énormes quantités de données sont déjà disponibles gratuitement, il est logique d'essayer aussi une approche de données-première (Goldberg 2015) .

Comme je l'ai montré dans ce chapitre, les chercheurs peuvent apprendre beaucoup en regardant les gens. Dans les trois chapitres suivants, je vais vous décrire comment nous pouvons apprendre plus et des choses différentes si nous adaptons notre collecte de données et d'interagir avec des gens plus directement en leur posant des questions (chapitre 3), en cours d'exécution des expériences (chapitre 4), et même les impliquant dans le processus de recherche directement (chapitre 5).