2.3.1.3 Ikke-reaktivt

Måling er mye mindre sannsynlig å endre atferd i store datakilder.

En utfordring for samfunnsforskning er at folk kan endre sin atferd når de vet at de blir observert av forskere. Samfunnsvitere generelt kaller dette atferdsendring i respons til forsker måling reaktivitet (Webb et al. 1966) . Et aspekt av store data at mange forsker finne lovende er at deltakerne er vanligvis ikke klar over at deres data blir tatt, eller de har blitt så vant til denne datainnsamling at det ikke lenger endrer sin atferd. Fordi de er ikke-reaktive derfor mange kilder til store data kan brukes til å studere oppførselen som ikke har vært amendable til nøyaktig måling tidligere. For eksempel Stephens-Davidowitz (2014) brukes utbredelsen av rasistiske begreper i søkemotoren søk for å måle rase animus i forskjellige regioner i USA. Den ikke-reaktiv og store (se forrige avsnitt) natur søkedata aktivert målinger som ville være vanskelig å bruke andre metoder, for eksempel undersøkelser.

Non-reaktivitet, men sikrer ikke at disse dataene er liksom en direkte gjenspeiler folks atferd eller holdninger. For eksempel som en respondent fortalte Newman et al. (2011) , "Det er ikke det at jeg ikke har problemer, jeg er bare ikke sette dem på Facebook." Med andre ord, selv om noen store datakilder er ikke-reaktiv, de er ikke alltid fri for sosial ønskelighet skjevhet , tendensen for folk til å ønske å presentere seg på best mulig måte. Videre, som jeg skal beskrive mer nedenfor, disse datakildene er ofte påvirket av målene for plattformeiere, et problem som kalles algoritmisk confounding (beskrevet mer nedenfor).

Selv om ikke-reaktivitet er fordelaktig for forskning, sporing folks atferd uten deres samtykke og bevissthet hever etiske hensyn omtalt nedenfor og i detalj i kapittel 6. En offentlig tilbakeslag mot økt digital overvåking kan føre store datasystemer for å bli mer reaktiv over tid, og sterk bekymring om digital overvåking kan også føre noen mennesker til å forsøke å melde deg ut av store datasystemer helt, økende bekymringer om ikke-representativitet (beskrevet mer nedenfor).

Disse tre gode egenskapene til store data for samfunnsforskning-store, alltid-på, og ikke-reaktiv-vanligvis oppstår fordi disse datakildene ikke ble skapt av forskere for forskning. Nå skal jeg slå til de syv egenskaper av store datakilder som er bra for forskning. Disse funksjonene har også en tendens til å oppstå fordi disse dataene ikke ble skapt av forskere for forskning.