2.3.2 Увек

Увек на великим података омогућава проучавање неочекиване догађаје и мерења у реалном времену.

Многи велики системи података су увек на; они су стално прикупљање података. Ово увек на карактеристика омогућава истраживачима лонгитудиналних података (нпр, подаци током времена). Бити увек на има две важне импликације за истраживање.

Прво, прикупљање података увек омогућава истраживачима да проучавају неочекиване догађаје на начине који иначе не би били могући. На примјер, истраживачи заинтересовани за проучавање протеста у Оццупи Гези у Турској током лета 2013. обично би се фокусирали на понашање демонстраната током догађаја. Церен Будак и Дунцан Ваттс (2015) били су у стању да учине више користећи увек везану природу Твитера за учење демонстраната који су користили Твиттер прије, током и након догађаја. И, успели су да креирају упоредну групу не-учесника пре, током и после догађаја (слика 2.2). Укупно њихова ек-пост панел укључила је твеетове од 30.000 људи током две године. Повећавајући најчешће коришћене податке из протеста са овим другим информацијама, Будак и Вотс су могли научити много више: они су могли проценити које врсте људи ће вероватније учествовати у протестима Гези и процијенити промјене у ставовима учеснике и не-учеснике, краткорочно (упоређујући пре-Гези током Гези) и на дужи рок (упоређујући пре-Гези са пост-Гези).

Слика 2.2: Дизајн који су користили Будак и Ваттс (2015) за проучавање протеста заузета Гезија у Турској током лета 2013. Користећи увек Твитеру, истраживачи су створили оно што су назвали ек-пост панел који укључује 30.000 људи током две године. За разлику од типичне студије која се фокусирала на учеснике током протеста, ек-пост панел додаје 1) податке учесника пре и после догађаја и 2) податке од не-учесника пре, током и након догађаја. Оваква обогаћена структура података омогућила је Будаку и Ваттсу да процене које врсте људи ће учествовати у протестима у Гезију и процијенити промјене у ставовима учесника и не-учесника, како у кратком року (упоређујући пре-Гези са током Гези ) и дугорочно (упоређујући пре-Гези са пост-Гези).

Слика 2.2: Дизајн који су користили Budak and Watts (2015) за проучавање протеста заузета Гезија у Турској током лета 2013. Користећи увек Твитеру, истраживачи су створили оно што су назвали ек-пост панел који укључује 30.000 људи током две године. За разлику од типичне студије која се фокусирала на учеснике током протеста, ек-пост панел додаје 1) податке учесника пре и после догађаја и 2) податке од не-учесника пре, током и након догађаја. Оваква обогаћена структура података омогућила је Будаку и Ваттсу да процене које врсте људи ће учествовати у протестима у Гезију и процијенити промјене у ставовима учесника и не-учесника, како у кратком року (упоређујући пре-Гези са током Гези ) и дугорочно (упоређујући пре-Гези са пост-Гези).

Скептик може указати на то да су неке од ових процјена могле бити направљене без увијек извора за прикупљање података (нпр. Дугорочне процјене промјене става), а то је тачно, иако би такво прикупљање података за 30.000 људи било сасвим скупо. Међутим, чак и уз неограничени буџет, не могу се сматрати ни на један други начин који у суштини омогућава истраживачима да путују уназад и непосредно посматрају понашање учесника у прошлости. Најтоплија алтернатива би била сакупљање ретроспективних извјештаја о понашању, али ови извјештаји би имали ограничену грануларност и упитну тачност. табела 2.1 пружа друге примере студија које користе извор података увек за проучавање неочекиваног догађаја.

Табела 2.1: Студије неочекиваних догађаја који користе увек велике изворе података.
Неочекивани догађај Алваис-он извор података Цитатион
Заузети Гези покрет у Турској Твиттер Budak and Watts (2015)
Протест кишобрана у Хонг Конгу Веибо Zhang (2016)
Пуцњаве полиције у Њујорку Стоп-анд-фриск извештаји Legewie (2016)
Особа која се придружује ИСИС-у Твиттер Magdy, Darwish, and Weber (2016)
11. септембра 2001. напад ливејоурнал.цом Cohn, Mehl, and Pennebaker (2004)
11. септембра 2001. напад пагер поруке Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Поред проучавања неочекиваних догађаја, увек на великим системима података такођер омогућавају истраживачима да праве процјене у реалном времену, што може бити важно у поставкама гдје креатори политике - у влади или индустрији - желе да одговоре на основу свијести о ситуацији. На пример, подаци о друштвеним мрежама могу се користити за вођење хитних реаговања на природне катастрофе (Castillo 2016) и могу се користити различити велики извори података који производе процјене економске активности у реалном времену (Choi and Varian 2012) .

У закључку, системи података који се користе увек омогућавају истраживачима да проучавају неочекиване догађаје и пружају информације у стварном времену креаторима политике. Међутим, не мислим да су увек системи података погодни за праћење промена у веома дугим временским периодима. То је зато што многи велики системи података се стално мењају-процес који ћу звати дрифт касније у (секција 2.3.7) Поглавље.