2.3.3 Jo reaktive

Matja në burimet e mëdha të të dhënave ka shumë më pak gjasa të ndryshojë sjelljen.

Një sfidë e hulumtimit shoqëror është se njerëzit mund të ndryshojnë sjelljen e tyre kur ata e dinë se ata po vëzhgohen nga kërkuesit. Shkencëtarët social zakonisht e quajnë këtë reaktivitet (Webb et al. 1966) . Për shembull, njerëzit mund të jenë më bujarë në studimet laboratorike sesa në studimet në terren sepse në të parën ata janë shumë të vetëdijshëm se ato janë duke u zbatuar (Levitt and List 2007a) . Një aspekt i të dhënave të mëdha që shumë kërkues të gjejnë premtues është se pjesëmarrësit në përgjithësi nuk janë të vetëdijshëm se të dhënat e tyre janë duke u kapur ose ata janë bërë aq të mësuar me këtë mbledhje të të dhënave që nuk ndryshon më sjelljen e tyre. Për shkak se pjesëmarrësit nuk reagojnë , prandaj, shumë burime të të dhënave të mëdha mund të përdoren për të studiuar sjellje që nuk kanë qenë të përshtatshme për matje të saktë më parë. Për shembull, Stephens-Davidowitz (2014) përdori prevalencën e termave racistë në pyetjet e motorëve të kërkimit për të matur animusin racial në rajone të ndryshme të Shteteve të Bashkuara. Jo-reaktive dhe të mëdha (shih seksionin 2.3.1) natyra e të dhënave të kërkimit mundësuan matjet që do të ishin të vështira duke përdorur metoda të tjera, të tilla si anketat.

Joaktiviteti, sidoqoftë, nuk siguron që këto të dhëna disi të jenë një pasqyrim i drejtpërdrejtë i sjelljes ose qëndrimeve të njerëzve. Për shembull, si një i anketuar në një studim të bazuar në intervistë tha: "Nuk është se nuk kam probleme, por nuk po i vë në Facebook" (Newman et al. 2011) . Me fjalë të tjera, edhe pse disa burime të mëdha të të dhënave janë jo reaktive, ato nuk janë gjithnjë të lira nga paragjykimet e dëshirueshmërisë sociale, tendenca që njerëzit të dëshirojnë të paraqesin veten në mënyrën më të mirë të mundshme. Më tej, siç do ta përshkruajmë më vonë në kapitull, sjellja e kapur në burimet e mëdha të të dhënave nganjëherë ndikohet nga qëllimet e pronarëve të platformave, një çështje që unë do të thërras algoritminë e ngatërruar . Së fundi, edhe pse joaktiviteti është i favorshëm për hulumtime, ndjekja e sjelljes së njerëzve pa pëlqimin dhe ndërgjegjësimin e tyre ngre shqetësime etike që unë do të përshkruaj në detaje në kapitullin 6.

Të tre pronat që sapo përshkrova-të mëdha, gjithnjë në-dhe jo-aktive-janë përgjithësisht, por jo gjithmonë, të dobishme për hulumtimet shoqërore. Tjetra, do të kthehem në shtatë pronat e burimeve të mëdha të të dhënave - të paplota, të paarritshme, jo-përfaqësuese, të shkyçur, algoritmikisht të hutuar, të ndotur dhe të ndjeshëm - që në përgjithësi, por jo gjithmonë, krijojnë probleme për kërkime.