2.3.1.2 Always-on

Always-on nagy adatok lehetővé teszik a vizsgálat váratlan események és a valós idejű mérés.

Sok nagy adatrendszerek mindig-on; azok folyamatosan gyűjti az adatokat. Ez mindig bekapcsolt jellemző kutatók így longitudinális adatokat (azaz az adatok idővel). Mivel mindig bekapcsolt két fontos következménnyel jár a kutatás.

Először is, mindig-on adatgyűjtés lehetővé teszi a kutatók, hogy tanulmányozza a váratlan események oly módon, hogy nem volt lehetséges korábban. Például a kutatók érdekli a tanulás az Occupy Gezi tüntetések Törökországban nyarán 2013 jellemzően összpontosítani viselkedését tüntetők a rendezvény ideje alatt. Ceren Budak és Duncan Watts (2015) volt képes többre segítségével a mindig a természetre a Twitter, hogy tanulmányozza a Twitter-használó tüntetők előtt, alatt és után az esemény. És képesek voltak létrehozni egy olyan összehasonlító csoportot nem résztvevő (vagy résztvevők, akik nem csipog a tiltakozás) előtt, alatt és után az esemény (2.1 ábra). Összességében ezek az utólagos panel tartalmazza a tweets 30.000 ember több mint két éve. Által gyarapítva az általánosan használt adatokat a tiltakozások ezzel más információt, Budak és Watts tudtak sokkal többet: tudták megbecsülni, milyen az emberek nagyobb valószínűséggel vesznek részt a Gezi tiltakozások és megbecsülni a változások attitűdök résztvevők és nem résztvevők, mind a rövid távú (összehasonlítva előre Gezi hogy közben Gezi), valamint a hosszú távú (összehasonlítva előre Gezi utáni Gezi).

2.1 ábra: Tervezési által használt Budak és Watts (2015), hogy tanulmányozza az Occupy Gezi tüntetések Törökországban nyarán 2013 használatával a mindig a természetre a Twitter, a kutatók létre, amit az úgynevezett utólagos panel, amely tartalmazta körülbelül 30.000 ember több mint két éve. Ezzel szemben a tipikus tanulmány középpontjában a résztvevők a tiltakozások során, az utólagos központ hozzáad 1) adatainak a résztvevők előtt és után az esemény, és 2) az adatok a nem résztvevők előtt, alatt és után az esemény. Ez dúsított adatstruktúra engedélyezve Budak és Watts megbecsülni, milyen az emberek nagyobb valószínűséggel vesznek részt a Gezi tiltakozások és megbecsülni a szemléletváltást a résztvevők és nem résztvevők, mind a rövid távú (összehasonlítva előre Gezi hogy közben Gezi), valamint a hosszú távú (összehasonlítva előre Gezi utáni Gezi).

2.1 ábra: Tervezési által használt Budak and Watts (2015) , hogy tanulmányozza az Occupy Gezi tüntetések Törökországban nyarán 2013 használatával a mindig a természetre a Twitter, a kutatók létre, amit az úgynevezett utólagos panel, amely tartalmazta körülbelül 30.000 ember több mint két éve. Ezzel szemben a tipikus tanulmány középpontjában a résztvevők a tiltakozások során, az utólagos központ hozzáad 1) adatainak a résztvevők előtt és után az esemény, és 2) az adatok a nem résztvevők előtt, alatt és után az esemény. Ez dúsított adatstruktúra engedélyezve Budak és Watts megbecsülni, milyen az emberek nagyobb valószínűséggel vesznek részt a Gezi tiltakozások és megbecsülni a szemléletváltást a résztvevők és nem résztvevők, mind a rövid távú (összehasonlítva előre Gezi hogy közben Gezi), valamint a hosszú távú (összehasonlítva előre Gezi utáni Gezi).

Igaz, hogy néhány ilyen becslések lehetett volna anélkül, hogy mindig-on adatgyűjtés forrásokból (pl hosszú távú becslések szemléletváltás), bár az ilyen adatgyűjtés 30.000 ember lett volna elég drága. És még mivel korlátlan költségvetést, nem tudok gondolni, hogy más módszer, amely lényegében lehetővé teszi a kutatók számára, utazás vissza az időben, és közvetlenül megfigyelni a résztvevők viselkedését a múltban. A legközelebbi alternatíva lenne összegyűjteni retrospektív beszámolók a viselkedés, de ezek a jelentések lenne korlátozott a felbontási és megkérdőjelezhető pontossággal. 2.1 táblázat ad további példát tanulmányok használó always-on adatforrás tanulni egy váratlan esemény.

2.1 táblázat: A tanulmányok váratlan eseményekről always-on nagy adatforrások.
váratlan esemény Always-on adatforrás Idézet
Occupy Gezi mozgás Törökországban Twitter Budak and Watts (2015)
Umbrella tiltakozások Hong Kong Weibo Zhang (2016)
Lövöldözés a rendőrség New Yorkban Stop-and-csóvál jelentések Legewie (2016)
Személy csatlakozott ISIS Twitter Magdy, Darwish, and Weber (2016)
Szeptember 11, 2001 támadás livejournal.com Cohn, Mehl, and Pennebaker (2004)
Szeptember 11, 2001 támadás pager üzenetek Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Másodszor, always-on adatgyűjtés lehetővé teszi a kutatók, és valós idejű mérések, amely lehet fontos, ahol a döntéshozók szeretnénk, hogy ne csak tanulni meglévő viselkedés, hanem reagálni. Például, a szociális média adatokat fel lehet használni, hogy irányítsák a válaszok a természeti katasztrófák (Castillo 2016) .

Összefoglalva, always-on adatok rendszerek lehetővé teszik a kutatók számára, hogy tanulmányozza a váratlan eseményekre, és valós idejű információkat a döntéshozók számára. Azt azonban nem, javaslom, hogy, hogy mindig-adatok rendszerek lehetővé teszik a kutatók számára, hogy a változások nyomon követése hosszú ideig. Mégpedig azért, mert sok nagy adatrendszerek folyamatosan változik-nek nevezett eljárás sodródás (Section 2.3.2.4).