2.3.1.3 Non réactif

La mesure est beaucoup moins susceptibles de changer de comportement dans les sources de données grandes.

Un défi de la recherche sociale est que les gens peuvent changer leur comportement quand ils savent qu'ils sont observés par les chercheurs. Les sociologues appellent généralement ce changement de comportement en réponse à la mesure du chercheur réactivité (Webb et al. 1966) , (Webb et al. 1966) . Un aspect de gros volumes de données que de nombreux chercheurs trouvent prometteurs est que les participants ne sont généralement pas conscients que leurs données sont capturés ou ils sont devenus tellement habitués à cette collecte de données qu'il ne modifie plus leur comportement. Parce qu'ils sont non réactifs, par conséquent, de nombreuses sources de données importantes peuvent être utilisées pour étudier le comportement qui n'a pas été amendable à une mesure précise précédemment. Par exemple, Stephens-Davidowitz (2014) a utilisé la prévalence des termes racistes dans les requêtes des moteurs de recherche pour mesurer la haine raciale dans les différentes régions des États-Unis. La nature non-réactive et grande (voir la section précédente) des données de recherche des mesures qui seraient difficiles à l'aide d'autres méthodes, telles que les enquêtes activé.

Non-réactivité, cependant, ne garantit pas que ces données sont en quelque sorte un effet direct de refléter le comportement ou les attitudes des gens. Par exemple, un répondant a dit Newman et al. (2011) , «Il est pas que je n'ai pas de problèmes, je suis tout simplement pas les mettre sur Facebook." En d' autres termes, même si certaines sources de données grands sont non réactifs, ils ne sont pas toujours exempts de biais de désirabilité sociale , la tendance des gens à vouloir se présenter de la meilleure façon possible. En outre, comme je décrirai plus bas, ces sources de données sont parfois influencés par les objectifs des propriétaires de la plate - forme, un problème appelé confusion algorithmique (décrite plus bas).

Bien que non-réactivité est avantageuse pour la recherche, le suivi du comportement des gens sans leur consentement et de sensibilisation soulève des préoccupations éthiques discutées ci-dessous et en détail au chapitre 6. Une réaction du public contre la surveillance numérique accrue pourrait conduire grands systèmes de données pour devenir plus réactif au fil du temps, et fort préoccupé par la surveillance numérique pourrait même conduire certaines personnes à tenter de choisir de grands systèmes de données complètement, les préoccupations croissantes au sujet de la non-représentativité (décrite plus bas).

Ces trois bonnes propriétés de grandes données pour la recherche-big sociale, toujours en service, et non réactive généralement survenir parce que ces sources de données ne sont pas créés par des chercheurs pour la recherche. Maintenant, je vais céder la parole aux sept propriétés des sources de données grandes qui sont mauvais pour la recherche. Ces caractéristiques ont également tendance à se produire parce que ces données n'a pas été créé par des chercheurs pour la recherche.