2.3.2 Vienmēr ieslēgta

Vienmēr-on lielie dati ļauj pētījumu par negaidītiem notikumiem un reālā laika mērījumiem.

Daudzi lielie datu sistēmas vienmēr-on; tie pastāvīgi datu vākšanai. Tas vienmēr-on īpašība nodrošina pētniekiem garengriezuma dati (ti, datu laika gaitā). Būt vienmēr-on ir divas svarīgas sekas pētniecībai.

Pirmkārt, pastāvīga datu vākšana ļauj pētniekiem pētīt negaidītus notikumus tādos veidos, kuri citādi nebūtu iespējami. Piemēram, pētnieki, kas ir ieinteresēti 2013. gada vasarā Turcijā apgūt Occupy Gezi protestus, parasti koncentrējas uz protestētāju uzvedību pasākuma laikā. Ceren Budak un Duncan Watts (2015) varēja paveikt vairāk, izmantojot čivināt, kas vienmēr tiek raksturīgi, lai pētītu protestētājus, kuri izmantoja čivināt pirms notikuma, tā laikā un pēc tā. Un viņi varēja izveidot salīdzinošo grupu dalībniekiem pirms notikuma, tā laikā un pēc tā (2.2. Attēls). Kopumā to ex-post panelī iekļāva tweets 30 000 cilvēku vairāk nekā divus gadus. Budak un Vatts, papildinot parasti izmantotos protesta datus ar šo citu informāciju, varēja uzzināt daudz vairāk: viņi varēja novērtēt, kādi cilvēki ir biežāk piedalījušies Gezi protestos, un novērtēt viņu attieksmes izmaiņas. gan īstermiĦā (salīdzinot pre-Gezi ar Gezi laikā), gan ilgtermiņā (salīdzinot pre-Gezi ar post-Gezi).

Attēls 2.2: Design, ko Budak un Watts (2015) izmanto, lai 2013. gada vasarā izpētītu okupē Gezi protestus Turcijā. Izmantojot ikmēneša čivināt, pētnieki izveidoja to, ko viņi sauc par ex-post paneļu, kas ietvēra aptuveni 30000 cilvēki vairāk nekā divus gadus. Atšķirībā no tipiska pētījuma, kurā dalībnieki piedalījās protestu laikā, ex post postenis papildina 1) dalībnieku datus pirms un pēc notikuma un 2) dalībnieku dati pirms notikuma, tā laikā un pēc tā. Šī bagātinātā datu struktūra ļāva Budakam un Vatam novērtēt, kādi cilvēki varētu piedalīties Gezi protestiem, kā arī novērtēt dalībnieku un dalībnieku attieksmju izmaiņas gan īstermiņā (salīdzinot pre-Gezi ar Gezi laika periodu ) un ilgtermiņā (salīdzinot pre-Gezi ar post-Gezi).

Attēls 2.2: Design, ko Budak and Watts (2015) lai 2013. gada vasarā izpētītu okupē Gezi protestus Turcijā. Izmantojot ikmēneša čivināt, pētnieki izveidoja to, ko viņi sauc par ex-post paneļu, kas ietvēra aptuveni 30000 cilvēki vairāk nekā divus gadus. Atšķirībā no tipiska pētījuma, kurā dalībnieki piedalījās protestu laikā, ex post postenis papildina 1) dalībnieku datus pirms un pēc notikuma un 2) dalībnieku dati pirms notikuma, tā laikā un pēc tā. Šī bagātinātā datu struktūra ļāva Budakam un Vatam novērtēt, kādi cilvēki varētu piedalīties Gezi protestiem, kā arī novērtēt dalībnieku un dalībnieku attieksmju izmaiņas gan īstermiņā (salīdzinot pre-Gezi ar Gezi laika periodu ) un ilgtermiņā (salīdzinot pre-Gezi ar post-Gezi).

Skeptisks varētu norādīt, ka dažas no šīm aplēsēm varēja tikt izdarītas bez jebkādiem datu vākšanas avotiem (piemēram, ilgtermiņa aplēses par attieksmes maiņu), un tas ir pareizi, lai gan šāds datu vākšana 30 000 cilvēkiem būtu bijis diezgan dārgi. Tomēr, neraugoties uz neierobežotu budžetu, es nevaru iedomāties nevienu citu metodi, kas principā ļauj pētniekiem atgriezties laikā un tieši novērot dalībnieku uzvedību agrāk. Tuvākā alternatīva būtu apkopot retrospektīvus uzvedības ziņojumus, taču šajos ziņojumos nebūtu pietiekami detalizēta un apšaubāma precizitāte. Tabulā 2.1 ir sniegti citi pētījumu piemēri, kuros vienmēr izmantots datu avots, lai pētītu negaidītu notikumu.

2.1. Tabula: Neparedzētu notikumu izpēte, izmantojot vienmēr lielus datu avotus.
Neparedzēts notikums Vienmērīgs datu avots Citāts
Aizņem Gezi kustību Turcijā Čivināt Budak and Watts (2015)
Umbrella protesti Honkongā Weibo Zhang (2016)
Policijas šāviens Ņujorkā Stop-and-frisk ziņojumi Legewie (2016)
Persona, kas pievienojas ISIS Čivināt Magdy, Darwish, and Weber (2016)
2001.gada 11.septembra uzbrukums livejournal.com Cohn, Mehl, and Pennebaker (2004)
2001.gada 11.septembra uzbrukums peidžeru ziņojumi Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Papildus neparedzētu notikumu izpētei vienmēr lielas datu sistēmas ļauj pētniekiem iegūt reāllaika aprēķinus, kas var būt svarīgi vietās, kur politikas veidotāji - valdībā vai nozarē - vēlas reaģēt, pamatojoties uz situācijas izpratni. Piemēram, sociālo mediju datus var izmantot, lai palīdzētu reaģēt ārkārtas situācijās dabas katastrofu gadījumos (Castillo 2016) un var izmantot dažādus lielus datu avotus, lai iegūtu ekonomiskās aktivitātes reāllaika aprēķinus (Choi and Varian 2012) .

Noslēgumā, pastāvīgas datu sistēmas ļauj pētniekiem izpētīt neparedzētus notikumus un sniegt informāciju politikas veidotājiem reāllaikā. Tomēr es nedomāju, ka pastāvīgas datu sistēmas ir piemērotas izmaiņu izsekošanai ļoti ilgu laiku. Tas ir tāpēc, ka daudzas lielas datu sistēmas nepārtraukti mainās - process, ko es aicināšu novirzīt vēlāk nodaļā (2.3.7. Sadaļa).