2.3.3 erreaktiboa

Datu iturri handien neurketa askoz ere gutxiago da portaera aldatzea.

Ikerketa sozialaren erronka da jendeak portaera aldatzen duela ikertzaileek ikusten ari direnean. Gizarte zientzialariek, oro har, erreaktibotasuna deitzen diete (Webb et al. 1966) . Adibidez, jendeak laborategiko ikasketetan baino ikasketa gehiago izan dezake, ikasitakoa baino askoz ere ohikoa delako (Levitt and List 2007a) . Ikertzaile askok itxaropentsua duten datu handien alderdi bat da parte-hartzaileek, oro har, ez direla jakitun datu horiek harrapatzen ari direnik, ez dute jada portaera aldatzen uzten. Parte-hartzaileek nonreactive delako, beraz, big datuak iturri asko erabili daitezke jokabidea ez dela neurketa zehatza frogatu aurretiaz aztertzeko. Esate baterako, Stephens-Davidowitz (2014) arrazista terminoen prebalentzia erabiltzen du bilatzaileen kontsultak Ameriketako Estatu Batuetako eskualde desberdinetan arrazako animus neurtzeko. Bilaketa-datuen ez-erreaktiboa eta handia (ikus 2.3.1. Atala) gaitutako neurketak, beste metodo batzuk erabiliz zaila izango lirateke, esate baterako inkestak.

Ez da erreaktibotasuna, ordea, ez du bermatzen datu horiek nolabait pertsonen portaera edo jarrerak zuzenean islatzen dituztela. Esate baterako, elkarrizketatutako azterketek erantzun zutenez, "Ez dut arazorik ez dudala, ez dut Facebook-ean jarri" (Newman et al. 2011) . Beste era batera esanda, nahiz eta datu-iturri handiak ez diren erreaktiboak izan, ez dira beti desiragarritasunaren bias doako joera, jendeak nahi duen moduan joateko joera. Aurrerago, kapitulu honetan azalduko dudan bezala, datu-iturri handietan harrapatutako portaera batzuetan jabeen helburuen eragina izaten da batzuetan, nahasketa algoritmiko bati deitzen diotena . Azkenik, ikerketarako abantaila ez den arren, jendaurreko portaerak beren baimenik gabe eta kontzientziarik gabe jarraitzen badituzte, 6. kapituluan xehetasunez azalduko ditut kezka etikoak.

I deskribatu ditugun hiru propietateak: handiak, beti-onak eta ez-erreaktiboak, orokorrean, baina ez dira beti, gizarte-ikerketarako onuragarriak. Hurrengoa, datu-iturri handien zazpi propietateetara joango naiz: osatu gabeak, eskuraezinak, ez ordezkariak, driftingak, algoritmikoki nahastuak, zikinak eta sentikorrak, oro har, baina ez beti, ikerketarako arazoak sortzen.