2.3.1.3 No reactiu

El mesurament és molt menys probable que canviï el comportament de les fonts de dades grans.

Un dels reptes de la investigació social és que les persones poden canviar el seu comportament quan saben que estan sent observats pels investigadors. Els científics socials en general, anomenen aquest canvi de comportament en resposta a la reactivitat de mesurament investigador (Webb et al. 1966) . Un aspecte de grans volums de dades que molts investigadors a trobar prometedor és que els participants generalment no són conscients que les seves dades estan sent capturats o s'han acostumat tant a aquest recull de dades que ja no canvia el seu comportament. A causa de que són no reactius, per tant, moltes fonts de dades grans es poden utilitzar per estudiar el comportament que no ha estat modificable per un mesurament precís anteriorment. Per exemple, Stephens-Davidowitz (2014) utilitza la prevalença de termes racistes a les consultes dels motors de cerca per mesurar l'animositat racial en diferents regions dels Estats Units. La naturalesa no reactiva i gran (veure secció anterior) de les dades de recerca activat mesures que serien difícils d'utilitzar altres mètodes, com les enquestes.

No reactivitat, però, no garanteixen que aquestes dades són d'alguna manera una forma directa de reflectir el comportament o les actituds de la gent. Per exemple, com un dels enquestats dit Newman et al. (2011) , "No és que jo no tinc problemes, només que no estic posant en Facebook." En altres paraules, tot i que algunes fonts de dades són grans no reactiu, que no sempre estan lliures de biaix de desitjabilitat social , la tendència de les persones que vulguin presentar-se de la millor manera possible. A més, com descriuré més endavant, aquestes fonts de dades a vegades són afectats pels objectius dels propietaris de la plataforma, un problema que es diu confusió algorísmica (descrit més endavant).

Tot i que no reactivitat és avantatjosa per a la investigació, el seguiment del comportament de les persones sense el seu consentiment i el coneixement planteja preocupacions ètiques discuteixen a continuació i en detall al capítol 6. Una reacció pública contra la vigilància digital augmentat podria portar sistemes de dades grans per ser més reactiva amb el temps, i fort preocupació per la vigilància digital podria fins i tot portar a algunes persones per intentar donar-se de baixa dels sistemes de dades grans per complet, la creixent preocupació per la no-representativitat (descrit més endavant).

Aquestes tres bones propietats de grans volums de dades per a la investigació social-gran, sempre actiu, i sorgeixen a causa de que aquestes fonts de dades no van ser creats pels investigadors per a la investigació no reactiu-general. Ara, Vaig al seu torn als set propietats de les fonts de dades grans que són dolents per a la investigació. Aquestes característiques també tendeixen a sorgir perquè aquesta informació no va ser creada pels investigadors per a la investigació.