2.3.1.2 Altyd-op

Altyd-op groot data in staat stel om die studie van onverwagse gebeure en real-time meting.

Baie groot data stelsels is altyd-op; Hulle is voortdurend die versameling van data. Dit altyd-op kenmerkende bied navorsers longitudinale data (dit wil sê, data met verloop van tyd). Om altyd-op het twee belangrike implikasies vir navorsing.

In die eerste plek altyd-op data-insameling in staat stel navorsers om onverwagte gebeurtenisse te bestudeer op 'n manier wat nie moontlik voorheen was. Byvoorbeeld, sou navorsers wat belangstel in die bestudering van die Occupy Gezi protes in Turkye in die somer van 2013 tipies fokus op die gedrag van die betogers tydens die geleentheid. CEREN Budak en Duncan Watts (2015) was in staat om meer deur die gebruik van die altyd-op die natuur van Twitter Twitter-gebruik van betogers voor te bestudeer, tydens doen, en na die gebeurtenis. En, het hulle in staat om 'n vergelyking groep nie-deelnemers (of deelnemers wat nie tweet oor die protes) skep voor, tydens en na die gebeurtenis (Figuur 2.1). In totaal ingesluit hul ex-post paneel die tweets van 30,000 mense oor twee jaar. Deur die aanvulling van die algemeen gebruik data van die protes met hierdie ander inligting, Budak en Watts was in staat om baie meer te leer: Hulle was in staat om te skat watter soort mense is meer geneig om deel te neem in die Gezi protes en om die veranderinge in houdings van skat deelnemers en nie-deelnemers, beide in die kort termyn (vergelyk pre-Gezi om tydens Gezi) en in die lang termyn (vergelyk pre-Gezi tot post-Gezi).

Figuur 2.1: Ontwerp deur Budak en Watts (2015) studeer die beset Gezi protes in Turkye in die somer van 2013. Deur die gebruik van die altyd-op die natuur van Twitter, het die navorsers geskep wat hulle noem 'n ex-post paneel wat oor ingesluit 30,000 mense oor twee jaar. In teenstelling die tipiese studie wat fokus op die deelnemers tydens die betogings, die ex-post paneel voeg 1) data van die deelnemers voor en na die gebeurtenis en 2) data van nie-deelnemers voor, tydens en na die gebeurtenis. Dit verryk datastruktuur enabled Budak en Watts te skat watter soort mense is meer geneig om deel te neem in die Gezi protes en om die veranderinge in houdings van deelnemers en nie-deelnemers skat, beide in die kort termyn (vergelyk pre-Gezi om tydens Gezi) en in die lang termyn (vergelyk pre-Gezi tot post-Gezi).

Figuur 2.1: Ontwerp deur Budak and Watts (2015) studeer die beset Gezi protes in Turkye in die somer van 2013. Deur die gebruik van die altyd-op die natuur van Twitter, het die navorsers geskep wat hulle noem 'n ex-post paneel wat oor ingesluit 30,000 mense oor twee jaar. In teenstelling die tipiese studie wat fokus op die deelnemers tydens die betogings, die ex-post paneel voeg 1) data van die deelnemers voor en na die gebeurtenis en 2) data van nie-deelnemers voor, tydens en na die gebeurtenis. Dit verryk datastruktuur enabled Budak en Watts te skat watter soort mense is meer geneig om deel te neem in die Gezi protes en om die veranderinge in houdings van deelnemers en nie-deelnemers skat, beide in die kort termyn (vergelyk pre-Gezi om tydens Gezi) en in die lang termyn (vergelyk pre-Gezi tot post-Gezi).

Dit is waar dat sommige van hierdie beramings gemaak kan word sonder om altyd-op dataversameling bronne (byvoorbeeld langtermyn skattings van houdingsverandering), hoewel versameling sulke data vir 30,000 mense baie duur sou gewees het. En, selfs gegewe 'n onbeperkte begroting, ek kan nie dink aan enige ander metode wat in wese navorsers toelaat om terug te reis in die tyd en deelnemers gedrag direk waarneem in die verlede. Die naaste alternatief sou wees om terugwerkende verslae van gedrag in te samel, maar hierdie verslae van beperkte korrelig en twyfelagtige akkuraatheid sou wees. Table 2.1 bied ander voorbeelde van studies wat gebruik 'n altyd-op databron om 'n onverwagte gebeurtenis bestudeer.

Tabel 2.1: Studies van onverwagse gebeure deur altyd-op groot databronne.
onverwagte gebeurtenis Altyd-op databron Citation
Beset Gezi beweging in Turkye Twitter Budak and Watts (2015)
Sambreel protes in Hong Kong Weibo Zhang (2016)
Skietery van die polisie in New York Stop-en-dartelen verslae Legewie (2016)
Persoon by ISIS Twitter Magdy, Darwish, and Weber (2016)
11 September, 2001 aanval livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 September, 2001 aanval pager boodskappe Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Tweede, altyd-op data-insameling in staat stel navorsers om real-time metings, wat belangrik is in instellings waar beleidmakers wil nie net leer uit bestaande gedrag nie, maar ook te reageer op dit kan wees produseer. Byvoorbeeld, kan sosiale media data word gebruik om antwoorde op natuurrampe lei (Castillo 2016) .

Ten slotte, altyd-op data stelsels in staat stel navorsers om onverwagte gebeurtenisse te bestudeer en te voorsien real-time inligting te beleidmakers. Ek het egter nie voorstel dat dit altyd op data stelsels in staat stel navorsers om veranderinge oor 'n lang tyd op te spoor. Dit is omdat baie groot data stelsels voortdurend veranderende-n proses genaamd drif (Afdeling 2.3.2.4).