2.3.2 Dejjem fuq

Dejjem fuq data big tippermetti l-istudju ta 'avvenimenti mhux mistennija u kejl fil-ħin reali.

Ħafna sistemi ta 'data kbar huma dejjem fuq; huma kontinwament ġbir ta 'data. Din il-karatteristika dejjem fuq tipprovdi riċerkaturi bi data lonġitudinali (jiġifieri, id-data matul iż-żmien). Li tkun dejjem fuq għandha żewġ implikazzjonijiet importanti għar-riċerka.

L-ewwel, il-ġbir tad-data dejjem jippermetti lir-riċerkaturi biex jistudjaw avvenimenti mhux mistennija b'modi li kieku ma kienx ikun possibbli. Per eżempju, riċerkaturi interessati li jistudjaw il-protesti Okkupati Gezi fit-Turkija fis-sajf tal-2013 tipikament jiffukaw fuq l-imġiba ta 'dimostranti matul l-avveniment. Ceren Budak u Duncan Watts (2015) setgħu jagħmlu aktar billi jużaw in-natura dejjem fuq Twitter biex jistudjaw lid-dimostranti li użaw Twitter qabel, matul u wara l-avveniment. U, setgħu joħolqu grupp ta 'paragun ta' nonparticipanti qabel, matul u wara l-avveniment (figura 2.2). B'kollox, il -bord ex-post tagħhom inkluda t-tweets ta '30,000 persuna fuq sentejn. Billi żiedet id-dejta użata b'mod komuni mill-protesti b'din l-informazzjoni l-oħra, Budak u Watts setgħu jitgħallmu ħafna iktar: setgħu jistmaw x'tipi ta 'nies kienu aktar probabbli li jipparteċipaw fil-protesti Gezi u biex jistmaw il-bidliet fl-attitudnijiet ta' parteċipanti u nonparticipants, kemm f'terminu qasir (li jqabblu pre-Gezi ma 'matul Gezi) u fit-tul (li jqabbel il-pre-Gezi mal-post-Gezi).

Figura 2.2: Disinn użat minn Budak u Watts (2015) biex jistudja l-protesti Okkupati Gezi fit-Turkija fis-sajf tal-2013. Bl-użu tan-natura dejjem fuq Twitter, ir-riċerkaturi ħolqu dak li huma jsejħu panel ex-post li kien jinkludi madwar 30,000 persuna fuq sentejn. B'kuntrast ma 'studju tipiku li ffoka fuq il-parteċipanti matul il-protesti, il-pannell ex-post iżid 1) dejta minn parteċipanti qabel u wara l-avveniment u 2) data minn nonparticipants qabel, matul u wara l-avveniment. Din l-istruttura ta 'data arrikkita ppermettiet lil Budak u Watts biex jistmaw x'tipi ta' nies kienu aktar probabbli li jipparteċipaw fil-protesti Gezi u biex jistmaw il-bidliet fl-attitudnijiet tal-parteċipanti u dawk mhux parteċipanti, kemm fuq żmien qasir (billi tqabbel pre- Gezi ma 'matul Gezi ) u fit-tul (li jqabbel il-pre-Gezi mal-post-Gezi).

Figura 2.2: Disinn użat minn Budak and Watts (2015) biex jistudja l-protesti Okkupati Gezi fit-Turkija fis-sajf tal-2013. Bl-użu tan-natura dejjem fuq Twitter, ir-riċerkaturi ħolqu dak li huma jsejħu panel ex-post li kien jinkludi madwar 30,000 persuna fuq sentejn. B'kuntrast ma 'studju tipiku li ffoka fuq il-parteċipanti matul il-protesti, il-pannell ex-post iżid 1) dejta minn parteċipanti qabel u wara l-avveniment u 2) data minn nonparticipants qabel, matul u wara l-avveniment. Din l-istruttura ta 'data arrikkita ppermettiet lil Budak u Watts biex jistmaw x'tipi ta' nies kienu aktar probabbli li jipparteċipaw fil-protesti Gezi u biex jistmaw il-bidliet fl-attitudnijiet tal-parteċipanti u dawk mhux parteċipanti, kemm fuq żmien qasir (billi tqabbel pre- Gezi ma 'matul Gezi ) u fit-tul (li jqabbel il-pre-Gezi mal-post-Gezi).

Skeptiku jista 'jindika li xi wħud minn dawn l-estimi setgħu saru mingħajr dejjem fuq sorsi ta' ġbir ta 'dejta (eż. Estimi fit-tul ta' bidla fl-attitudni), u dan huwa korrett, għalkemm tali ġabra ta 'dejta għal 30,000 persuna kienet tkun pjuttost għali. Anke jekk ingħata baġit illimitat, madankollu, ma nistax naħseb dwar xi metodu ieħor li essenzjalment jippermetti li r-riċerkaturi jivvjaġġaw lura fiż-żmien u josservaw direttament l-imġiba tal-parteċipanti fil-passat. L-eqreb alternattiva tkun li jinġabru rapporti retrospettivi ta 'mġieba, iżda dawn ir-rapporti jkunu ta' granularità limitata u preċiżjoni dubjuża. tabella 2.1 tipprovdi eżempji oħra ta 'studji li jużaw sors ta' dejta dejjem-fuq biex jistudjaw avveniment mhux mistenni.

Tabella 2.1: Studji ta 'avvenimenti mhux mistennija bl-użu ta' sorsi kbar ta 'data dejjem.
Avveniment mhux mistenni Dejjem fuq is-sors tad-dejta Ċitazzjoni
Okkupa l-moviment ta 'Gezi fit-Turkija Twitter Budak and Watts (2015)
Protesti Umbrella f'Hong Kong Weibo Zhang (2016)
Rimedji tal-pulizija fi New York City Rapporti "stop-and-frisk" Legewie (2016)
Persuna li tingħaqad ma 'ISIS Twitter Magdy, Darwish, and Weber (2016)
11 ta 'Settembru, 2001 attakk livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 ta 'Settembru, 2001 attakk messaġġi ta 'pagaturi Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Minbarra l-istudju ta 'avvenimenti mhux mistennija, dejjem fuq is-sistemi ta' dejta kbar jippermettu wkoll li r-riċerkaturi jipproduċu estimi f'ħin reali, li jistgħu jkunu importanti f'ambjenti fejn dawk li jfasslu l-politika fil-gvern jew fl-industrija jridu jirrispondu skont għarfien tas-sitwazzjoni. Pereżempju, id-dejta tal-midja soċjali tista 'tintuża biex tiggwida r-reazzjoni ta' emerġenza għal diżastri naturali (Castillo 2016) u tista 'tintuża varjetà ta' sorsi ta 'data kbar differenti li jipproduċu estimi f'ħin reali ta' attività ekonomika (Choi and Varian 2012) .

Bħala konklużjoni, dejjem fuq is-sistemi tad-dejta jippermettu li r-riċerkaturi jistudjaw avvenimenti mhux mistennija u jipprovdu informazzjoni f'ħin reali lil dawk li jfasslu l-politika. Madankollu, jien ma naħsibx li dejjem fuq is-sistemi tad-dejta huma adattati tajjeb biex insegwu l-bidliet fuq perjodi twal ħafna ta 'żmien. Dan huwa minħabba li ħafna sistemi ta 'data kbar qed jinbidlu-proċess li jien ser sejħa drift aktar tard fil-kapitolu (sezzjoni 2.3.7).