2.3.2 Altyd aan

Altyd-op groot data in staat stel om die studie van onverwagse gebeure en real-time meting.

Baie groot data stelsels is altyd-op; Hulle is voortdurend die versameling van data. Dit altyd-op kenmerkende bied navorsers longitudinale data (dit wil sê, data met verloop van tyd). Om altyd-op het twee belangrike implikasies vir navorsing.

In die eerste plek maak dit altyd moontlik dat navorsers onverwagte gebeure bestudeer op maniere wat andersins nie moontlik sou wees nie. Byvoorbeeld, navorsers wat belangstel om die Occupy Gezi-protes in Turkye in die somer van 2013 te bestudeer, sal tipies fokus op die gedrag van betogers tydens die geleentheid. Ceren Budak en Duncan Watts (2015) was in staat om meer te doen deur die gebruik van die voortdurende natuur van Twitter te gebruik om betogers te gebruik wat Twitter voor, gedurende en na die geleentheid gebruik het. En hulle kon 'n vergelykingsgroep van nie-deelnemers voor, gedurende en na die gebeurtenis skep (figuur 2.2). In totaal het hul ekspaneelpaneel die tweets van 30,000 mense oor twee jaar ingesluit. Deur die algemeen gebruikte data uit die protes met hierdie ander inligting te vergroot, kon Budak en Watts baie meer leer: hulle was in staat om te skat watter soort mense meer geneig was om aan die Gezi-protes deel te neem en die veranderinge in houdings van deelnemers en nie-deelnemers, beide op kort termyn (vergelykende pre-Gezi na Gezi) en op lang termyn (vergelyking van pre-Gezi met post-Gezi).

Figuur 2.2: Ontwerp wat deur Budak en Watts (2015) gebruik word om die Beweg Gezi-protes in Turkye in die somer van 2013 te bestudeer. Deur die gebruik van die altyd-op-die-natuur van Twitter, het die navorsers geskep wat hulle 'n ex-paneelpaneel genoem het wat oor 30.000 mense oor twee jaar. In teenstelling met 'n tipiese studie wat tydens die betogings op deelnemers gefokus het, voeg die ekspaneelpaneel 1) data van deelnemers voor en na die gebeurtenis en 2) data van nie-deelnemers voor, gedurende en na die gebeurtenis. Hierdie verrykde datastruktuur het Budak en Watts in staat gestel om te bepaal watter soort mense meer geneig was om deel te neem aan die Gezi-protes en om die veranderinge in houdings van deelnemers en nie-deelnemers te beoordeel, beide op kort termyn (vergelyking van pre-Gezi tydens Gezi ) en op die lang termyn (vergelyking van pre-Gezi met post-Gezi).

Figuur 2.2: Ontwerp wat deur Budak and Watts (2015) gebruik word om die Beweg Gezi-protes in Turkye in die somer van 2013 te bestudeer. Deur die gebruik van die altyd-op-die-natuur van Twitter, het die navorsers geskep wat hulle 'n ex-paneelpaneel genoem het wat oor 30.000 mense oor twee jaar. In teenstelling met 'n tipiese studie wat tydens die betogings op deelnemers gefokus het, voeg die ekspaneelpaneel 1) data van deelnemers voor en na die gebeurtenis en 2) data van nie-deelnemers voor, gedurende en na die gebeurtenis. Hierdie verrykde datastruktuur het Budak en Watts in staat gestel om te bepaal watter soort mense meer geneig was om deel te neem aan die Gezi-protes en om die veranderinge in houdings van deelnemers en nie-deelnemers te beoordeel, beide op kort termyn (vergelyking van pre-Gezi tydens Gezi ) en op die lang termyn (vergelyking van pre-Gezi met post-Gezi).

'N Skeptiese kan daarop wys dat sommige van hierdie ramings sonder onophoudelike data-insamelingsbronne gemaak kon word (bv. Langtermynberamings van houdingsverandering) en dit is korrek, hoewel so 'n data-insameling vir 30 000 mense nogal sou gewees het duur. Selfs 'n onbeperkte begroting gegee, kan ek egter nie aan enige ander metode dink wat navorsers in wese toelaat om betyds terug te keer en die gedrag van deelnemers in die verlede direk te waarneem nie. Die naaste alternatief sal wees om terugwerkende verslae van gedrag te versamel, maar hierdie verslae sal van beperkte korrelasie en twyfelagtige akkuraatheid wees. tabel 2.1 verskaf ander voorbeelde van studies wat 'n voortdurend data bron gebruik om 'n onverwagte gebeurtenis te bestudeer.

Tabel 2.1: Studie van onverwagte gebeure deur gebruik te maak van altyd-groot databronne.
Onverwagte gebeurtenis Altyd op data bron aanhaling
Beoefen Gezi-beweging in Turkye Twitter Budak and Watts (2015)
Sambreel protes in Hong Kong Weibo Zhang (2016)
Skietery van die polisie in New York Stop-en-vars verslae Legewie (2016)
Persoon wat by ISIS aansluit Twitter Magdy, Darwish, and Weber (2016)
11 September 2001 aanval livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 September 2001 aanval pager boodskappe Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Behalwe om onverwagte gebeure te bestudeer, stel altyd-op groot datastelsels ook navorsers in staat om real-time ramings te produseer. Dit kan belangrik wees in instellings waar beleidmakers in die regering of in die industrie wil reageer op grond van situasionele bewustheid. Byvoorbeeld, sosiale media data kan gebruik word om noodreaksie op natuurrampe (Castillo 2016) en 'n verskeidenheid verskillende groot data bronne kan gebruik word om real-time ramings van ekonomiese aktiwiteit te produseer (Choi and Varian 2012) .

Ten slotte stel altyd-op-datastelsels navorsers in staat om onverwagte gebeure te bestudeer en real-time inligting aan beleidsmakers te bied. Ek dink egter nie dat altyd-op-datastelsels goed geskik is vir die dop van veranderinge oor baie lang tydperke nie. Dit is omdat baie groot datastelsels voortdurend verander - 'n proses wat ek later in die hoofstuk gaan dryf (afdeling 2.3.7).