2.3.2 Mindig bekapcsolva

Always-on nagy adatok lehetővé teszik a vizsgálat váratlan események és a valós idejű mérés.

Sok nagy adatrendszerek mindig-on; azok folyamatosan gyűjti az adatokat. Ez mindig bekapcsolt jellemző kutatók így longitudinális adatokat (azaz az adatok idővel). Mivel mindig bekapcsolt két fontos következménnyel jár a kutatás.

Először is, a folyamatos adatgyűjtés lehetővé teszi a kutatók számára, hogy olyan váratlan eseményeket tanulmányozzanak, amelyek egyébként nem lennének lehetségesek. Például azok a kutatók, akik 2013 nyarán a Törökországban elfoglalták a Gezi-i tiltakozásokat, érdeklődnek általában a tüntetők magatartására. Ceren Budak és Duncan Watts (2015) többet tudtak tenni azzal, hogy a Twitter mindig a természeténél fogva megtudta a tennivalókat, akik a Twittert használják az esemény előtt, alatt és után. És képesek voltak létrehozni egy összehasonlító csoportot a résztvevők között az esemény előtt, alatt és után (2.2. Ábra). Összesen ex-post panelükben 30.000 ember tweetje volt a két év alatt. A tiltakozásokkal közösen használt adatokkal kiegészítve ezzel a másik információval Budak és Watts sokkal többet tudtak tanulni: tudták megbecsülni, hogy milyen emberek nagyobb valószínűséggel vesznek részt a Gezi-tüntetésekben, és becsülik meg a változások viselkedését. a résztvevők és a nem résztvevők mind rövid távon (összehasonlítva a pre-Gezi-t a Gezi alatt), és hosszú távon (összehasonlítva a pre-Gezit a poszt-Gezivel).

2.2. Ábra: A Budak és a Watts (2015) által használt módszer, amely 2013 nyarán vizsgálja meg a Törökországban elfoglalt Gezi-tüntetéseket. A Twitter állandó jellegénél fogva a kutatók létrehozták azt, amit ex-post panelnek neveztek. 30 000 ember két év alatt. Ellentétben egy tipikus tanulmánygal, amely a tiltakozások során a résztvevőkre összpontosított, az ex-post panel a következőket adja hozzá: 1) a résztvevők adatai az esemény előtt és után, valamint 2) a résztvevők adatai az esemény előtt, alatt és után. Ez a gazdag adatszerkezet lehetővé tette, hogy a Budák és a Watts becsülje meg, hogy milyen emberek nagyobb valószínűséggel vesznek részt a gezei tüntetésekben, és rövid időn belül becsülik a résztvevők és a nem résztvevők magatartásának változásait (összehasonlítva a Gezi-et a Gezi alatt ) és hosszú távon (összehasonlítva a pre-Gezi-t a poszt-Gezi-val).

2.2. Ábra: A Budak and Watts (2015) által használt módszer, amely 2013 nyarán vizsgálja meg a Törökországban elfoglalt Gezi-tüntetéseket. A Twitter állandó jellegénél fogva a kutatók létrehozták azt, amit ex-post panelnek neveztek. 30 000 ember két év alatt. Ellentétben egy tipikus tanulmánygal, amely a tiltakozások során a résztvevőkre összpontosított, az ex-post panel a következőket adja hozzá: 1) a résztvevők adatai az esemény előtt és után, valamint 2) a résztvevők adatai az esemény előtt, alatt és után. Ez a gazdag adatszerkezet lehetővé tette, hogy a Budák és a Watts becsülje meg, hogy milyen emberek nagyobb valószínűséggel vesznek részt a gezei tüntetésekben, és rövid időn belül becsülik a résztvevők és a nem résztvevők magatartásának változásait (összehasonlítva a Gezi-et a Gezi alatt ) és hosszú távon (összehasonlítva a pre-Gezi-t a poszt-Gezi-val).

A szkeptikus rámutathat arra, hogy ezek a becslések némelyike ​​nem mindig adatgyűjtési források nélkül történhetne (pl. Hosszú távú becslések a hozzáállás megváltoztatására), és helyes, bár egy ilyen adatgyűjtés 30 000 ember számára elég volt drága. Még korlátlan költségvetés mellett sem gondolhatok olyan más módszerekre, amelyek lényegében lehetővé teszik a kutatók számára az időben történő utazást, és közvetlenül figyelik a résztvevők magatartását a múltban. A legközelebbi alternatíva a visszamenőleges viselkedésről szóló beszámolók összegyűjtése lenne, de ezek a jelentések korlátozott határtalan és megkérdőjelezhető pontosságúak lennének. a 2.1. táblázat további példákat mutat be olyan vizsgálatokra, amelyek egy mindig bekapcsolt adatforrást használnak egy váratlan esemény vizsgálatára.

2.1. Táblázat: A váratlan események vizsgálata mindig nagy adatforrások használatával.
Váratlan esemény Mindig bekapcsolt adatforrás Idézet
Fogadja Gezi mozgalmát Törökországban Twitter Budak and Watts (2015)
Esküvői tiltakozások Hongkongban Weibo Zhang (2016)
A rendőrség lőszerei New Yorkban Stop-and-frisk jelentések Legewie (2016)
Az ISIS-hez csatlakozó személy Twitter Magdy, Darwish, and Weber (2016)
2001. szeptember 11-i támadás livejournal.com Cohn, Mehl, and Pennebaker (2004)
2001. szeptember 11-i támadás pager üzeneteket Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

A váratlan események tanulmányozása mellett a mindig nagy adatrendszerek lehetővé teszik a kutatók számára, hogy valós idejű becsléseket készítsenek, amelyek fontosak lehetnek olyan környezetben, ahol a politikai döntéshozók - a kormányzatban vagy az iparban - a helyzetfeltárás alapján reagálnak. Például a közösségi médiaadatok felhasználhatók a természeti katasztrófákra adott válaszok (Castillo 2016) és számos különböző nagy adatforrás felhasználható valós idejű gazdasági becslések készítésére (Choi and Varian 2012) .

Összefoglalva, a folyamatosan működő adatrendszerek lehetővé teszik a kutatók számára, hogy váratlan eseményeket tanuljanak, és valós idejű információt nyújtsanak a döntéshozóknak. Nem gondolom azonban, hogy az állandóan működő adatrendszerek nagyon alkalmasak a változások nyomon követésére nagyon hosszú időn keresztül. Ez azért van, mert sok nagy adatrendszerek folyamatosan változik-egy folyamat, hívom sodródás később a fejezetben (2.3.7 szakasz).