2.3.2 Gjithmonë-në

Gjithmonë-në të dhënat e mëdha mundëson studimin e ngjarjeve të papritura dhe matjen në kohë reale.

Shumë sisteme të mëdha të të dhënave janë gjithmonë-në; ata janë vazhdimisht mbledhjen e të dhënave. Kjo karakteristikë gjithmonë-në ofron hulumtuesit me të dhënat e gjatësisë (p.sh., të dhënat me kalimin e kohës). Duke qenë gjithmonë-në ka dy implikime të rëndësishme për kërkime.

Së pari, gjithnjë në mbledhjen e të dhënave mundëson hulumtuesit të studiojnë ngjarje të papritura në mënyra që përndryshe nuk do të ishin të mundshme. Për shembull, studiuesit e interesuar për të studiuar protestat e Occupy Gezi në Turqi në verën e vitit 2013 zakonisht do të fokusoheshin në sjelljen e protestuesve gjatë kësaj ngjarjeje. Ceren Budak dhe Duncan Watts (2015) ishin në gjendje të bënin më shumë duke përdorur gjithnjë natën e Twitter për të studiuar protestuesit që përdorën Twitter para, gjatë dhe pas ngjarjes. Dhe, ata ishin në gjendje të krijojnë një grup krahasimi të pjesëmarrësve që nuk janë pjesëmarrës para, gjatë dhe pas ngjarjes (figura 2.2). Në total, paneli i tyre ex-post përfshiu tweets e 30,000 njerëzve gjatë dy viteve. Duke shtuar të dhënat e përdorura zakonisht nga protestat me këtë informacion tjetër, Budak dhe Watts ishin në gjendje të mësonin shumë më tepër: ata ishin në gjendje të vlerësonin se çfarë lloj personash kishin më shumë gjasa të merrnin pjesë në protesta Gezi dhe të vlerësonin ndryshimet në qëndrimet e pjesëmarrësit dhe jo pjesëmarrësit, si në periudhën afatshkurtër (duke krahasuar para-Gezi me gjatë Gezi) dhe në afat të gjatë (duke krahasuar para-Gezi me post-Gezi).

Figura 2.2: Projektimi i përdorur nga Budak dhe Watts (2015) për të studiuar protestat e Occupy Gezi në Turqi në verën e vitit 2013. Duke përdorur natyrën e vazhdueshme të Twitter, kërkuesit krijuan atë që ata e quajtën një panel ex-post që përfshinte 30,000 njerëz mbi dy vjet. Në kontrast me një studim tipik që u përqendrua tek pjesëmarrësit gjatë protestave, paneli ex-post shton 1) të dhëna nga pjesëmarrësit para dhe pas ngjarjes dhe 2) të dhëna nga pjesmarrësit para, gjatë dhe pas ngjarjes. Kjo strukturë e pasuruar e të dhënave mundësoi Budak dhe Watts të vlerësojnë se çfarë lloj personash kanë më shumë gjasa të marrin pjesë në protesta Gezi dhe të vlerësojnë ndryshimet në qëndrimet e pjesëmarrësve dhe jo pjesëmarrësve, si në periudhën afatshkurtër (duke krahasuar para-Gezi me gjatë Gezi ) dhe në afat të gjatë (duke krahasuar para-Gezi me post-Gezi).

Figura 2.2: Projektimi i përdorur nga Budak and Watts (2015) për të studiuar protestat e Occupy Gezi në Turqi në verën e vitit 2013. Duke përdorur natyrën e vazhdueshme të Twitter, kërkuesit krijuan atë që ata e quajtën një panel ex-post që përfshinte 30,000 njerëz mbi dy vjet. Në kontrast me një studim tipik që u përqendrua tek pjesëmarrësit gjatë protestave, paneli ex-post shton 1) të dhëna nga pjesëmarrësit para dhe pas ngjarjes dhe 2) të dhëna nga pjesmarrësit para, gjatë dhe pas ngjarjes. Kjo strukturë e pasuruar e të dhënave mundësoi Budak dhe Watts të vlerësojnë se çfarë lloj personash kanë më shumë gjasa të marrin pjesë në protesta Gezi dhe të vlerësojnë ndryshimet në qëndrimet e pjesëmarrësve dhe jo pjesëmarrësve, si në periudhën afatshkurtër (duke krahasuar para-Gezi me gjatë Gezi ) dhe në afat të gjatë (duke krahasuar para-Gezi me post-Gezi).

Një skeptik mund të theksojë se disa nga këto vlerësime mund të bëhen pa gjithmonë në burimet e mbledhjes së të dhënave (p.sh. vlerësimet afatgjata të ndryshimit të qëndrimit) dhe kjo është e saktë, megjithëse një mbledhje e tillë e të dhënave për 30,000 njerëz do të ishte mjaft shtrenjtë. Megjithëkëtë, duke pasur parasysh një buxhet të pakufizuar, nuk mund të mendoj për ndonjë metodë tjetër që në thelb i lejon kërkuesit të udhëtojnë prapa në kohë dhe të vëzhgojnë drejtpërdrejt sjelljen e pjesëmarrësve në të kaluarën. Alternativa më e afërt do të ishte mbledhja e raporteve retrospektive të sjelljes, por këto raporte do të ishin me granularitet të kufizuar dhe saktësi të diskutueshme. Tabela 2.1 jep shembuj të tjerë të studimeve që përdorin një burim të të dhënave gjithmonë për të studiuar një ngjarje të papritur.

Tabela 2.1: Studimet e ngjarjeve të papritura duke përdorur gjithnjë në burimet e mëdha të të dhënave.
Ngjarje e papritur Gjithmonë-në burim të të dhënave citim
Zëni lëvizjen Gezi në Turqi Cicëroj Budak and Watts (2015)
Protestat ombrellë në Hong Kong Weibo Zhang (2016)
Shuarja e policisë në qytetin e Nju Jorkut Raportet Stop-and-frisk Legewie (2016)
Personi që bashkohet me ISIS Cicëroj Magdy, Darwish, and Weber (2016)
Sulmi i 11 shtatorit 2001 livejournal.com Cohn, Mehl, and Pennebaker (2004)
Sulmi i 11 shtatorit 2001 mesazhet pager Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Përveç studimit të ngjarjeve të papritura, gjithnjë në sistemet e mëdha të të dhënave u mundësojnë kërkuesve të prodhojnë vlerësime në kohë reale, të cilat mund të jenë të rëndësishme në mjediset ku krijuesit e politikave - në qeveri apo industri - dëshirojnë të përgjigjen në bazë të ndërgjegjësimit në situatë. Për shembull, të dhënat e medias sociale mund të përdoren për të udhëzuar reagimin emergjent ndaj fatkeqësive natyrore (Castillo 2016) dhe mund të përdoren një sërë burimesh të ndryshme të dhënash të prodhuara në vlerësime reale të aktivitetit ekonomik (Choi and Varian 2012) .

Në përfundim, sistemet e të dhënave gjithnjë në dispozicion u mundësojnë kërkuesve të studiojnë ngjarje të papritura dhe të japin informacione në kohë reale për politikëbërësit. Sidoqoftë, nuk mendoj se sistemet e të dhënave gjithmonë të përshtatshme janë të përshtatshme për gjurmimin e ndryshimeve gjatë periudhave shumë të gjata kohore. Kjo është për shkak se shumë sisteme të mëdha të të dhënave janë vazhdimisht në ndryshim-një proces që unë do të thërrasë domethënie më vonë në kapitullin (seksioni 2.3.7).