2.3.2 Әрқашан қосулы

Әрқашан-үлкен деректер күтпеген оқиғалар мен нақты уақытта өлшеу зерттеу мүмкіндік береді.

Көптеген Big Data Systems әрдайым-бар; олар үнемі деректерді жинау. Бұл әрдайым қосулы сипаттамасы бойлық деректер (ұзақ уақыт бойы, яғни, деректер) бар зерттеушілерге ұсынады. әрқашан қосулы бола зерттеу үшін екі маңызды мәнге ие.

Біріншіден, әрдайым деректерді жинау зерттеушілерге күтпеген оқиғаларды зерттеуге мүмкіндік береді, олар басқаша болмайды. Мысалға, 2013 жылдың жазында Түркиядағы «Гези» шабуылын оқуға қызығушылық танытқан зерттеушілер, әдетте, іс-шара кезінде наразылық білдірушілердің мінез-құлқына назар аударатын болады. Керен Будак және Дункан Ваттс (2015) Twitter-нің іс-шара алдында, уақыттағы және кейінгі Twitter-ті пайдаланатын наразылық акцияны оқып-үйрену үшін Twitter-тың әрдайым табиғатын пайдалану арқылы көп нәрсе істей алды. Сонымен қатар, олар оқиғадан бұрын, уақытында және оқиғадан кейін қатыспайтын топтарды құруға қабілетті (2.2-сурет). Барлығы екі жылда 30 мың адамнан тұратын твиттердің эксельдік тақтасы болды . Осы мәліметтермен бірге наразылықтардан кеңінен қолданылған деректерді кеңейту арқылы Будак пен Уотс әлдеқайда көп біле алды: олар қандай адамдар Гезийдегі наразылық акцияларына қатысуға және олардың көзқарастарының өзгеруін бағалайтындығына баға бере алды. қысқа мерзімде (Гезиге дейін Гезиге дейінгі салыстыру) және ұзақ мерзімді кезеңде (гезиттен кейінгі гезиттерді салыстыру) қатысушылары мен қатысушылары.

Сурет 2.2: 2013 жылдың жазында Түркиядағы «Турки Гуи» наразылықтарын зерттеу үшін Budak және Watts (2015) пайдаланған дизайн. Twitter-дің әрдайым табиғатын қолданып, зерттеушілер, Екі жылдан астам 30 000 адам. Қатысушыларға наразылық шараларын өткізу кезінде қатысқан типтік зерттеуден айырмашылығы, экс-панель 1) оқиғадан бұрын және кейінгі қатысушылардың деректерін және 2) оқиғадан бұрын, кезінде және одан кейінгі қатысушыдан алынған деректерді қосады. Бұл байытылған мәліметтер құрылымы Гудзий наразылықтарына қатысушылардың неғұрлым ықтималдығы бар екенін және қысқа мерзімде де (Гезиге дейін Гезиді салыстыру барысында) қатысушылардың және қатыспаған қатысушылардың өзгеруін бағалау үшін Бадак пен Уаттсқа мүмкіндік берді ) және ұзақ мерзімді перспективада (гезиттен кейінгі гезиттерді салыстыру).

2.2 сурет: пайдаланылатын Дизайн Budak and Watts (2015) Twitter сипаты әрқашан қосулы, зерттеушілер, олар туралы енгізілген экс-пост панелі деп аталатын қандай құрылған пайдалана отырып, 2013 жылдың жазында Түркияда Қыдыру наразылық Оккупай оқуға Екі жылдан астам 30 000 адам. Қатысушыларға наразылық шараларын өткізу кезінде қатысқан типтік зерттеуден айырмашылығы, экс-панель 1) оқиғадан бұрын және кейінгі қатысушылардың деректерін және 2) оқиғадан бұрын, кезінде және одан кейінгі қатысушыдан алынған деректерді қосады. Бұл байытылған мәліметтер құрылымы Гудзий наразылықтарына қатысушылардың неғұрлым ықтималдығы бар екенін және қысқа мерзімде де (Гезиге дейін Гезиді салыстыру барысында) қатысушылардың және қатыспаған қатысушылардың өзгеруін бағалау үшін Бадак пен Уаттсқа мүмкіндік берді ) және ұзақ мерзімді перспективада (гезиттен кейінгі гезиттерді салыстыру).

Шүбәсіз осы деректердің кейбірі деректерді жинау көздері болмаса да (мысалы, қатынас өзгеруінің ұзақ мерзімді бағалауларынсыз) жасалуы мүмкін екенін көрсете алады, бірақ мұндай деректерді жинау 30 000 адамға арналған еді қымбат. Дегенмен шектеусіз бюджет болғанымен, зерттеушілерге уақытында кері қайтуға және өткен уақытта қатысушылардың мінез-құлқын қадағалауға мүмкіндік беретін кез-келген басқа әдіс туралы ойлана алмаймын. Ең жақын баламалы мінез-құлықтың ретроспективті есептерін жинау еді, бірақ бұл есептер шектелмеген және күмәнді дәлдікке ие болады. 2.1-кестеде күтпеген оқиғаны зерттеу үшін әрдайым деректер көзін қолданатын зерттеулердің басқа мысалдары келтірілген.

Кесте 2.1: Әрқашан үлкен деректер көздерін пайдаланып күтпеген оқиғаларды зерттеу.
Күтпеген оқиға Әрдайым деректер көзі Citation
Түркиядағы Гези қозғалысын басып алды Twitter Budak and Watts (2015)
Гонконгта шабуылға қарсы наразылық Weibo Zhang (2016)
Нью-Йорк полициясының түсірілімі Стоп-және-фишкалар туралы есептер Legewie (2016)
ISIS-ке қосылу адамы Twitter Magdy, Darwish, and Weber (2016)
2001 жылғы 11 қыркүйектегі шабуыл livejournal.com Cohn, Mehl, and Pennebaker (2004)
2001 жылғы 11 қыркүйектегі шабуыл пейджер хабарлары Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Күтпеген оқиғаларды зерттеуден басқа, әрқашан үлкен деректер жүйелері зерттеушілерге нақты жағдайларды бағалауға мүмкіндік береді, бұл саясатты жасаушылар үкіметте немесе салада жағдайлық хабардарлыққа негізделген жауап беруге тырысады. Мысалы, әлеуметтік медиа деректер табиғи апаттарға (Castillo 2016) төтенше жағдайды жою үшін пайдаланылуы мүмкін және әртүрлі үлкен деректер көздері экономикалық белсенділіктің нақты уақыттық бағаларын шығару үшін пайдаланылуы мүмкін (Choi and Varian 2012) .

Қорытындылай келе, әрдайым деректер жүйелері зерттеушілерге күтпеген оқиғаларды зерттеуге және саясаткерлерге нақты уақыттық ақпарат беруге мүмкіндік береді. Дегенмен, мен әрдайым деректер жүйелерінің өте ұзақ уақыт бойы өзгерістерді бақылап отыру үшін жақсы деп ойлаймын. Көптеген ірі деректер жүйелері үнемі өзгеріп-бір себебі Мен тараудың (бөлім 2.3.7) кейінірек дрейф қоңырау шаламыз процесін болып табылады.