2.3.3 reagáló

A nagy adatforrások mérése sokkal kevésbé valószínű, hogy megváltoztatja a viselkedést.

A társadalmi kutatás egyik kihívása az, hogy az emberek megváltoztathatják magatartásukat, ha tudják, hogy a kutatók megfigyelik őket. A társadalomtudósok általában ezt a reaktivitást nevezik (Webb et al. 1966) . Például az emberek nagyobb lehetnek laboratóriumi vizsgálatokban, mint a terepi tanulmányok, mert az előbbiekben nagyon tisztában vannak azzal, hogy megfigyelik őket (Levitt and List 2007a) . A nagy adatok egyik szempontja, amelyet sok kutató ígéretesnek tart, az, hogy a résztvevők általában nem tudják, hogy adataikat elfogják, vagy olyan módon hozzászoktak hozzá, hogy ez az adatgyűjtés már nem változtatja meg viselkedését. Mivel a résztvevők nem reagálnak , ezért számos nagy adatforrás használható olyan viselkedés tanulmányozására, amely korábban nem volt megfelelő a pontos méréshez. Például Stephens-Davidowitz (2014) a rasszista kifejezések prevalenciáját használta a keresőmotor lekérdezésekben, hogy megmérje a faji animuszokat az Egyesült Államok különböző régióiban. A keresési adatok nemreaktív és nagy (lásd 2.3.1. Szakasz) jellegű méreteit nehéz lenne más módszerekkel, például felmérésekkel használni.

A nemreaktivitás azonban nem biztosítja, hogy ezek az adatok valahogy közvetlenül tükrözik az emberek viselkedését vagy attitűdjét. Például, mint egy interjúalany-kutatásban egy válaszadó azt mondta: "Nem arról van szó, hogy nincsenek problémák, csak nem teszem őket a Facebookon" (Newman et al. 2011) . Más szavakkal, annak ellenére, hogy egyes nagy adatforrások nem reagálnak, nem mindig mentesülnek a társadalmi kívánatosságtól, az emberek hajlamától, hogy a lehető legjobban bemutassák magukat. Továbbá, amint később részletesen leírom a fejezetet, a nagy adatforrásokban elfoglalt viselkedés néha befolyásolja a platform tulajdonosok céljait, egy kérdést, amelyet algoritmikus zavarnak nevezhetek. Végül, noha a reaktivitás előnyös a kutatás szempontjából, az emberek viselkedésének figyelembevétele nélkül és a tudatosság nyomon követése olyan etikai aggályokat vet fel, amelyeket részletesen a 6. fejezetben ismertetem.

Az a három tulajdonság, amelyet most írtam le - nagy, mindig is, és nem reaktív - általában, de nem mindig, előnyös a társadalmi kutatás számára. Ezután a nagy adatforrások hét tulajdonságával foglalkozom - hiányos, megközelíthetetlen, nem reprezentatív, sodródó, algoritmikusan összezavarodott, piszkos és érzékeny - általában, de nem mindig okoz problémákat a kutatás számára.