2.3.1.2 Visada ant

Visada ant didelių duomenų leidžia netikėtų įvykių ir realaus laiko matavimo tyrimą.

Daugelis didelių duomenų sistemos yra visada ant; jie nuolat rinkti duomenis. Tai visada ant savybė suteikia tyrėjams išilginio pjūvio duomenų (ty duomenų laike). Būdamas visada ant yra du svarbių pasekmių tyrimus.

Pirma, visada ant duomenų rinkimas leidžia mokslininkams tirti netikėtų įvykių tokiais būdais, kurie nebuvo įmanoma anksčiau. Pavyzdžiui, mokslininkai, besidomintys studijuoja Užima Gezi protestus Turkijoje 2013 metų vasarą būtų paprastai sutelkti dėmesį į protestuotojų elgesį įvykio metu. Ceren Budak ir Duncanas W (2015) galėjo padaryti daugiau naudojant visada ant pobūdį Twitter prieš studijuoti Twitter per protestuotojų, per ir po renginio. Ir jie sugebėjo sukurti palyginimo grupę ne dalyvių (arba dalyviai, kurie nebuvo Čivināšana apie protesto) prieš, per ir po renginio (2.1 pav.) Iš viso jų ex post pultas įtrauktas 30.000 žmonių tweets daugiau kaip dvejus metus. Iki plėsti dažniausiai naudojamas duomenis iš protestų su šiuo kita informacija, Budak ir vatai galėjo išmokti daug daugiau: jie galėjo įvertinti, kokių rūšių žmonių buvo labiau linkę dalyvauti Gezi protestų ir įvertinti savo požiūrį į pokyčius dalyviai ir ne dalyviai, tiek trumpuoju laikotarpiu (lyginant anksto gezi į per gezi) ir ilgalaikių (lyginant anksto gezi kad galėtumėte-gezi).

2.1 pav dizainas naudojamas Budak ir vatais (2015) studijuoti Užima Gezi protestus Turkijoje 2013 metų vasarą Naudodamiesi visada ant pobūdį Twitter, mokslininkai sukūrė tai, ką jie pavadino ex-post komisiją, kuri įtraukta apie 30.000 žmonių per dvejus metus. Priešingai tipiškas tyrimas, orientuota į dalyvių per protestus, ex post pultas prideda 1) duomenis iš dalyvių prieš ir po renginio ir 2) duomenys iš ne dalyviams prieš, per ir po renginio. Tai praturtintas duomenų struktūra leido budak ir Watts įvertinti, kokių rūšių žmonių buvo labiau linkę dalyvauti Gezi protestų ir įvertinti savo požiūrį dalyvių ir ne dalyvių pokyčius, tiek trumpuoju laikotarpiu (lyginant anksto Gezi į per gezi) ir ilgalaikių (lyginant anksto Gezio kad galėtumėte-Gezio).

2.1 pav dizainas naudojamas Budak and Watts (2015) studijuoti Užima Gezi protestus Turkijoje 2013 metų vasarą Naudodamiesi visada ant pobūdį Twitter, mokslininkai sukūrė tai, ką jie pavadino ex-post komisiją, kuri įtraukta apie 30.000 žmonių per dvejus metus. Priešingai tipiškas tyrimas, orientuota į dalyvių per protestus, ex post pultas prideda 1) duomenis iš dalyvių prieš ir po renginio ir 2) duomenys iš ne dalyviams prieš, per ir po renginio. Tai praturtintas duomenų struktūra leido budak ir Watts įvertinti, kokių rūšių žmonių buvo labiau linkę dalyvauti Gezi protestų ir įvertinti savo požiūrį dalyvių ir ne dalyvių pokyčius, tiek trumpuoju laikotarpiu (lyginant anksto Gezi į per gezi) ir ilgalaikių (lyginant anksto Gezio kad galėtumėte-Gezio).

Tiesa, kad kai kurie iš šių apskaičiavimų galėjo būti ne visada ant duomenų rinkimo šaltinių (pvz, ilgalaikiai vertinimai požiūrio kaita), nors tokie duomenys kolekcija 30.000 žmonių būtų buvę gana brangus. Ir net suteikta neribotą biudžetą, aš negaliu galvoti apie bet kurį kitą metodą, kad iš esmės leidžia mokslininkams keliauti atgal laiku ir tiesiogiai stebėti dalyvių elgesį praeityje. Artimiausias alternatyva būtų surinkti atgaline data ataskaitas elgesio, tačiau šie pranešimai būtų ribota detalumo ir abejotino tikslumo. 2.1 lentelėje pateikiami kitų pavyzdžių tyrimų, kurie naudoja visada ant duomenų šaltinio studijuoti netikėtą įvykį.

2.1 lentelė: Tyrimai netikėtų įvykių, naudojant visada ant didelių duomenų šaltiniais.
netikėtas įvykis Visada duomenimis šaltinis citata
Užima Gezi judėjimą Turkijoje "Twitter" Budak and Watts (2015)
Skėčių protestai Honkonge Weibo Zhang (2016)
Šaudyklos policijos New York City Stop-and-Frisk pranešimus Legewie (2016)
Asmuo prisijungti ISIS "Twitter" Magdy, Darwish, and Weber (2016)
11 Rgs 2001 išpuolis livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 Rgs 2001 išpuolis pager pranešimai Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Antra, visada ant duomenų rinkimas leidžia mokslininkams gaminti realiu laiku matavimus, kurie gali būti svarbūs aplinkoje, kur politikai nori ne tik mokytis iš esamo elgesio, bet ir atsakyti į jį. Pavyzdžiui, socialinės žiniasklaidos duomenys gali būti naudojami nukreipti atsakymus į stichinių nelaimių (Castillo 2016) .

Taigi, visada duomenimis sistemos leidžia mokslininkams studijuoti netikėtų įvykių ir teikti realaus laiko informaciją politikos formuotojams. Aš ne, tačiau, pasiūlyti, kad šis visada duomenimis sistemos įgalinti tyrinėtojus stebėti pokyčius per ilgą laiką. Tai yra todėl, kad daugelis didelių duomenų sistemas nuolat keičiasi-procesas vadinamas dreifo (2.3.2.4 skirsnį).