2.3.3 Nereaktivna

Merjenje v velikih virih podatkov je veliko manj verjetno, da bi spremenilo vedenje.

Eden od izzivov družbenih raziskav je, da lahko ljudje spremenijo svoje vedenje, ko vedo, da jih opazujejo raziskovalci. Socialne znanstvenike na splošno imenujejo to reaktivnost (Webb et al. 1966) . Na primer, ljudje so lahko v laboratorijskih raziskavah bolj radodarni kot na terenskih študijah, saj se v prvem zavedajo, da jih opazujemo (Levitt and List 2007a) . Eden od vidikov velikih podatkov, za katere mnogi raziskovalci menijo, da je obetaven, je, da se udeleženci na splošno ne zavedajo, da se njihovi podatki ujamejo ali so se tako navadili na to zbirko podatkov, da ne spreminja več svojega vedenja. Ker so udeleženci nereaktivni , se lahko za preučevanje vedenja, ki ga prej ni bilo mogoče natančno meriti, uporabijo številni viri velikih podatkov. Na primer, Stephens-Davidowitz (2014) uporabil razširjenost rasističnih izrazov v iskalnih poizvedbah za merjenje rasnega animusa v različnih regijah Združenih držav. Nereaktivna in velika (glej oddelek 2.3.1) narava meritev, ki so omogočile iskanje podatkov, kar bi bilo težko z uporabo drugih metod, kot so ankete.

Neaktivnost pa ne zagotavlja, da so ti podatki nekako neposreden odraz vedenja ali odnosa ljudi. Na primer, kot je rekel eden izmed anketirancev v raziskavi, ki je temeljila na intervjuju, "to ni, da nimam težav, jih ne postavljam na Facebook" (Newman et al. 2011) . Z drugimi besedami, čeprav so nekateri veliki viri podatkov nereaktivni, niso vedno brez privlačnosti socialne želje, težnje, da se ljudje želijo predstaviti na najboljši možen način. Nadalje, kot bom opisal kasneje v poglavju, vedenje, ujeto v velikih virih podatkov, včasih vplivajo na cilje lastnikov platform, problem, ki ga bom poklical z algoritmično zmedo . Nazadnje, čeprav je neaktivnost koristna za raziskave, sledenje vedenju ljudi brez njihovega privoljenja in zavesti sproža etične pomisleke, ki jih bom podrobno opisal v 6. poglavju.

Tri lastnosti, ki sem jih pravkar opisala - velika, vedno na in neaktivna - so na splošno, vendar ne vedno, ugodna za družbene raziskave. Nato se obrnem na sedem lastnosti velikih podatkovnih virov - nepopolne, nedostopne, neregistrirane, viseče, algoritmično zmedene, umazane in občutljive - kar na splošno, a ne vedno, povzroča težave pri raziskavah.