2.3.2 Altyd op

Always-op grutte gegevens stelt de stúdzje fan ûnferwachte eveneminten en real-time mjitting.

In protte grutte gegevens systemen binne altyd-op; se wurde hieltyd it sammeljen fan gegevens. Dit altyd-op karakteristyk jout ûndersikers mei longitudinaal gegevens (ie, gegevens oer tiid). Being altyd-op hat twa wichtige gefolgen foar ûndersyk.

Earst, altyd op datasammeljen kin ûndersikers ûnferwachte eveneminten ûndersiikje op wegen dy't net oars mooglik wêze. Bygelyks binne ûndersikers dy't yn 'e simmer fan 2013 ûndersykje te ûndersykjen fan' e Occupy Gezi protesten yn Turkije yn 'e simmer fan 2013 soe it gewoan op it gedrach fan' e protestanten yn 't barre rjochtsje. Ceren Budak en Duncan Watts (2015) kinne mear dwaan troch it brûken fan de altiten op natuer fan Twitter om ûndersikers te studearjen dy't Twitter foardat, yn en nei it barren brûkt hawwe. En, se wienen in fergeliking groep fan nonparticipanten te meitsjen foar, yn 'e nach en nei it evenemint (figuer 2.2). Yn totaal hawwe har eks- postpaniel de tweets fan 30.000 minsken oer twa jier opnommen. Troch it útwreidzjen fan gewoan gebrûkte gegevens fan 'e protesten mei dizze oare ynformaasje, kinne Budak en Watts folle mear leare: se wisten te beskriuwen hokker soarten minsken wierskynlik meidwaan meidwaan oan' e Gezi-protesten en om de feroaringen yn 'e hâlding fan dielnimmers en net-partisipanten, sawol op 'e koarte termyn (fergeliking foar Gezi oant Gezi) en op lange termyn (fergeliking foar Gezi mei post-Gezi).

Ofbylding 2.2: Design troch Budak en Watts brûkt (2015) om de besetting fan 'e Gezi-protesten yn' t Turkije te studearjen yn 'e simmer fan 2013. Mei de altiten op Twitter's binne de ûndersikers kreas makke wat se in ex-post paniel namen oer 30.000 minsken oer twa jier. Yn tsjinstelling ta in typysk ûndersyk dat rjochte is op dielnimmers by de protesten, befettet it ex-postpaniel 1) gegevens fan dielnimmers foar en nei it evenemint en 2) gegevens fan net-dielnimmers foar, yn en nei it barren. Dizze fertroude datakonstruksje soarge Budak en Watts om te beskôgjen wat soarten minsken wierskynber meidwaan oan de Gezi-protesten en om de feroaringen yn 'e hâlding fan dielnimmers en net-dielnimmers te beskate, sawol op' e koarte termyn (fergeliking foar Gezi mei Gezi ) en op lange termyn (fergelykje foar Gezi mei post-Gezi).

Ofbylding 2.2: Design troch Budak and Watts (2015) om de besetting fan 'e Gezi-protesten yn' t Turkije te studearjen yn 'e simmer fan 2013. Mei de altiten op Twitter's binne de ûndersikers kreas makke wat se in ex-post paniel namen oer 30.000 minsken oer twa jier. Yn tsjinstelling ta in typysk ûndersyk dat rjochte is op dielnimmers by de protesten, befettet it ex-postpaniel 1) gegevens fan dielnimmers foar en nei it evenemint en 2) gegevens fan net-dielnimmers foar, yn en nei it barren. Dizze fertroude datakonstruksje soarge Budak en Watts om te beskôgjen wat soarten minsken wierskynber meidwaan oan de Gezi-protesten en om de feroaringen yn 'e hâlding fan dielnimmers en net-dielnimmers te beskate, sawol op' e koarte termyn (fergeliking foar Gezi mei Gezi ) en op lange termyn (fergelykje foar Gezi mei post-Gezi).

In skeptikus kin oanjaan dat guon fan dizze skatten sûnder altyd op data sammelingsboarnen makke wurde kinne (bygelyks langstannige skatten fan attitude-feroaring), en dat is krekt, hoewol't sa'n dataekolleksje foar 30.000 minsken frij wêze soe djoer. Sawol in unlimitearre budzjet kin lykwols net tinke oan in oare metoade dy't de ûndersikers yn 'e rin fan elke wize tagelyk reizgje kinne en direkt it gedrach fan dielnimmers yn it ferline observearje. It tichteste alternatyf soe wêze moatte om retrosjale rapporten fan gedrach te sammeljen, mar dizze rapporten soe fan beheind koartereens wêze en dúdlikens genôch. Tabel 2.1 jout oare foarbylden fan stúdzjes dy't gebrûk meitsje fan in altyd op dat boarne om in unferwachts evenemint te studearjen.

Tabel 2.1: Untwerp fan unferwachte eveneminten dy't altyd brûke mei grutte data-boarnen.
Unferwachts evenemint Altyd op gegevensboarne Citation
Bewurkje Gezibeweging yn Turkije Twitter Budak and Watts (2015)
Regelmjittige protesten yn Hong Kong Weibo Zhang (2016)
Shootings fan plysje yn New York City Stop-en-frisk berjochten Legewie (2016)
Persoan byinoar by ISIS Twitter Magdy, Darwish, and Weber (2016)
11 septimber 2001 oanfalle livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 septimber 2001 oanfalle pager-berjochten Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Neist it ûntdekken fan unferwachte eveneminten, altyd op grutte datasjemooglikheden kinne ûndersikers ek meitsje om echte-timings te meitsjen, dy't wichtich wêze kinne yn 'e ynstellings dêr't politike makkers yn regearing of yndustry wolle op reagearje op basis fan situaasje bewustwêzen. Sa kinne bygelyks sosjale mediagegevens brûkt wurde foar it behertigjen fan needdrugs op natuerlike rampen (Castillo 2016) en in ferskaat oan ferskate grutte data boarnen kinne gebrûk meitsje fan echte-tiidskattaten fan 'e ekonomyske aktiviteit (Choi and Varian 2012) .

Yn ôfsluting kinne altyd op datassysteem ûndersikers ynskeakelje om unferwachte eveneminten te studearjen en realisearjende ynformaasje te jaan oan beliedsmakkers. Ik tink lykwols net dat dat altyd op datasysteem suksesfol binne foar it kontrolearjen fan feroaringen oer tige lange tydskriften. Dat is om't in protte grutte datasysystemen hieltyd feroarje - in proses dat ik letter sprekke sil yn it haadstik (seksje 2.3.7).