2.3.3 Netreaktyf

Meitsjen yn grutte gegevensboarnen is folle minder wierskynlik gedrach feroarje.

Ien útdaging fan sosjale ûndersyk is dat minsken har gedrach feroarje kinne as se witte dat se troch ûndersikers beoardiele wurde. Sosjale wittenskippers neamt dizze reaktiviteit oer (Webb et al. 1966) . Foarbylden kinne minsken lykwols mear yn labourûndersiik wêze as fjildûndersiken om't yn 'e eardere se tige bewust binne dat se observearre wurde (Levitt and List 2007a) . Ien aspekt fan grutte gegevens dy't in soad ûndersikers faker belibje, is dat dielnimmers algemien net bewust binne dat har gegevens opnommen wurde of se binne sa geweldich wurden oan dizze sammelings dat se har gedrach net mear feroarje. Om't dielnimmers net- reaktive binne , kinne dus in soad boarnen fan grutte data brûkt wurde om it gedrach te studearjen dy't earder net foar genôch mjittings foarsteld is. Stephens-Davidowitz (2014) brûkte bygelyks de befolking fan rasistyske begripen yn sykmasines fan 'e sykmasjines om Stephens-Davidowitz (2014) te mjitten yn ferskate regio's fan' e Feriene Steaten. De netreaktive en grutte (sjoch ôfdieling 2.3.1) natuer fan 'e sykdatabaten befettet mjittingen dy't swier wêze moatte mei oare metoaden, lykas omfragen.

Net-reaktiviteit lykwols makket net foar dat dizze gegevens ienris streekrjochte refleksje fan 'e gedrach of hâlding fan' e minsken. Bygelyks as ien respondint yn in ynterviewsbasearre stúdzje sei, "It is net dat ik gjin problemen hawwe, ik bin gewoan net op Facebook set." (Newman et al. 2011) . Mei oare wurden, al binne guon grutte gegevens boarnen net reaktyf, se binne net altyd fergees fan sosjale winsklike foardielen, de tendins foar minsken dy't har op 'e bêste mooglikheid prate wolle. Fierder, lykas ik letter yn it haadstik beskriuwt, wurdt it gedrach yn grutte data boarnen bepaald troch de doelen fan platfoarmbeskriuwers, in probleem dy't ik algoritmyske ferfeling jaan wol . Uteinlik, hoewol't net reaktiviteit foar it ûndersyk foardielich is, it hâlden fan it gedrach fan 'e minsken sûnder har ynstimming en bewustwêzen heakket etyske dingen dy't ik yn detail yn haadstik 6 beskriuwe sil.

De trije eigenskippen dy't ik krekt beskreau - grut, altyd, en net reaktyf - binne algemien, mar net altyd, foardielich foar sosjale ûndersyk. Dêrnei geane ik wer nei de sân eigenskippen fan grutte gegevensboarnen - ûnfolslein, net te kommen, net-represintatyf, driftend, algoritmysk konfrontearre, dreaun en sensibel - dat oer it generaal, mar net altyd, problemen foar ûndersyk meitsje.