2.3.2 Alati sisse lülitatud

Alati on suur andmed võimaldavad uuringu ootamatud sündmused ja reaalajas mõõtmiseks.

Paljud suured infosüsteemid on alati sees; nad on pidevalt andmete kogumisel. See alati-omadus annab teadlastele kestevandmetest (st andmete ajas). Olles alati-on kaks olulist mõju uuringuid.

Esiteks võimaldab pidev andmekogumine teadlastel õppida ootamatuid sündmusi viisil, mis muidu poleks võimalik. Näiteks uurivad huvirühmad, kes on huvitatud Türgi okupeeritud Gezi protestide uurimisest 2013. aasta suvel, keskenduma tavaliselt meeleavaldajate käitumisele sündmuse ajal. Ceren Budak ja Duncan Watts (2015) suutsid teha rohkem, kasutades Twitteri pidevat olemust, et uurida meeleavaldajat, kes kasutas vidistama enne sündmust, selle ajal ja pärast seda. Ja nad suutsid luua mitteosalejate võrdlusrühma enne sündmust, selle ajal ja pärast seda (joonis 2.2). Kokkuvõttes hõlmas nende tagasiside paneel kahte aasta jooksul 30 000 inimese tweets. Suurendades üldiselt kasutatavaid andmeid protestide kohta selle muu teabega, võisid Budak ja Watts õppida palju rohkem: nad suutsid hinnata, millised inimesed tõenäolisemalt osalesid Gezi protestides, ja hinnata nende hoiakute muutusi osalejad ja mitteosalejad, nii lühiajalises perspektiivis (eel-Gezi võrdlus Gezi aja järgi) kui ka pikemas perspektiivis (pre-Gezi ja Gezi-ga seotud võrdlus).

Joonis 2.2: Disain, mida Budak ja Watts (2015) kasutavad Türgi okupeeritud Gezi protestide uurimiseks 2013. aasta suvel. Twitteri pideva loomise abil loonud teadlased, mida nad nimetasid ex-post paneeliks, mis sisaldas umbes 30000 inimest üle kahe aasta. Erinevalt tüüpilisest uuringust, mis keskendus osalejatele meeleavalduste ajal, lisab järelkontrolli paneel 1) osalejate andmed enne ja pärast sündmust ja 2) osalejate andmed enne, sündmuse ajal ja pärast seda. See rikastatud andmestruktuur võimaldas Budakil ja Wattil hinnata, millised inimesed osalesid tõenäolisemalt Gezi protestides, ning hinnata osalejate ja mitteosaliste suhtumiste muutusi mõlemas lühikeses perspektiivis (Gezi eelkäijate võrdlus Gezi ajaga ) ja pikas perspektiivis (eel-Gezi ja Gezi-järgse versiooni võrdlus).

Joonis 2.2: Disain, mida Budak and Watts (2015) kasutavad Türgi okupeeritud Gezi protestide uurimiseks 2013. aasta suvel. Twitteri pideva loomise abil loonud teadlased, mida nad nimetasid ex-post paneeliks, mis sisaldas umbes 30000 inimest üle kahe aasta. Erinevalt tüüpilisest uuringust, mis keskendus osalejatele meeleavalduste ajal, lisab järelkontrolli paneel 1) osalejate andmed enne ja pärast sündmust ja 2) osalejate andmed enne, sündmuse ajal ja pärast seda. See rikastatud andmestruktuur võimaldas Budakil ja Wattil hinnata, millised inimesed osalesid tõenäolisemalt Gezi protestides, ning hinnata osalejate ja mitteosaliste suhtumiste muutusi mõlemas lühikeses perspektiivis (Gezi eelkäijate võrdlus Gezi ajaga ) ja pikas perspektiivis (eel-Gezi ja Gezi-järgse versiooni võrdlus).

Skeptik võib märkida, et mõnda neist hinnangutest oleks võinud teha alati ilma andmekogumisallikateta (nt hoiaku muutuste pikaajalised hinnangud) ja see on õige, kuigi selline andmete kogumine 30 000 inimese jaoks oleks olnud üsna kallis. Isegi piiramatu eelarve korral ei saa ma mõelda ühtegi muud meetodit, mis võimaldab teadlastel aja jooksul reisi tagasi ja jälgida otseselt osalejate käitumist minevikus. Lähim alternatiiviks on retrospektiivsete käitumisaruannete kogumine, kuid need aruanded on piiratud üksikasjalikkuse ja küsitavuse täpsusega. Tabelis 2.1 on toodud muud näited uuringutest, mis kasutavad ootamatu sündmuse uurimiseks alati andmeallikat.

Tabel 2.1: Uuringud ootamatute sündmuste kohta, kasutades alati suurt andmeallikaid.
Ootamatu sündmus Pidev andmeallikas Viide
Hõivata Gezi liikumine Türgis Twitter Budak and Watts (2015)
Umbrella protestid Hong Kongis Weibo Zhang (2016)
New York City politsei üritused Stop-and-frisk aruanded Legewie (2016)
Isis, kes ühineb ISISiga Twitter Magdy, Darwish, and Weber (2016)
11. september 2001 rünnak livejournal.com Cohn, Mehl, and Pennebaker (2004)
11. september 2001 rünnak piipari sõnumeid Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Lisaks ootamatute sündmuste uurimisele võimaldavad alati alati suured andmesüsteemid anda teadlastele reaalajas hinnanguid, mis võivad olla olulised seadistustes, kus poliitikakujundajad - valitsuses või tööstuses - soovivad reageerida olukorrast teadlikkusest lähtuvalt. Näiteks võib sotsiaalse meedia andmeid kasutada loodusõnnetuste korral erakorraliseks reageerimiseks (Castillo 2016) ja mitmesuguseid suuri andmeallikaid saab kasutada majandusaktiivsuse reaalajas hinnangu andmiseks (Choi and Varian 2012) .

Kokkuvõtteks võib öelda, et alati kasutatavad andmesüsteemid võimaldavad teadlastel õppida ootamatuid sündmusi ja anda reaalajas teavet poliitikakujundajatele. Ma ei arva siiski, et pidevalt kasutatavad andmesüsteemid sobivad hästi muudatuste jälgimiseks väga pikka aega. Seda seetõttu, et paljud suured infosüsteemid muutuvad pidevalt-protsess, mis ma helistan triivida hiljem peatükki (punkt 2.3.7).