2.3.1.2 uvijek na

Uvijek na velikim podataka omogućuje istraživanje neočekivanih događaja i mjerenja u realnom vremenu.

Mnogi veliki sustavi podataka su uvijek na; oni su stalno prikupljanje podataka. To je uvijek na svojstvo omogućuje istraživačima longitudinalnih podataka (tj podataka tijekom vremena). Biti uvijek na ima dvije važne implikacije za istraživanje.

Prvo, uvijek na prikupljanje podataka omogućuje istraživačima da proučavaju neočekivanim događajima na načine koji nisu bili mogući ranije. Na primjer, istraživači zainteresirani za proučavanje Occupy Gezi prosvjedima u Turskoj, u ljeto 2013. godine obično bi se usredotočiti na ponašanje prosvjednika tijekom događaja. Ceren Budak i Duncan Watts (2015) bili u mogućnosti učiniti više pomoću uvijek na prirodu Twitter na studij Twitter-pomoću prosvjednike prije, za vrijeme i nakon natjecanja. A, oni su bili u stanju stvoriti usporednoj skupini ne-sudionicima (ili sudionika koji nisu tweet o prosvjedu) prije, za vrijeme i nakon natjecanja (Slika 2.1). Ukupno je njihova naknadna ploča uključena tweetove 30.000 ljudi više od dvije godine. Povećavajući se obično koriste podatke iz protesta se s ovim drugim informacijama, Budak i Watts su mogli naučiti mnogo više: oni su bili u stanju procijeniti što vrste ljudi su više vjerojatno da će sudjelovati u Gezi prosvjedima i procjenu promjena u stavovima sudionici i ne-sudionicima, kako u kratkom roku (uspoređujući prethodno Gezi na vrijeme Gezi) i dugoročno (uspoređujući prethodno Gezi u post-Gezi).

Slika 2.1: Dizajn koriste Budak i Watts (2015) za proučavanje Occupy Gezi prosvjedima u Turskoj, u ljeto 2013. godine Korištenjem uvijek na prirodu Twitter, istraživači su stvorili ono što se zove ex-post ploču koja je uključivala oko 30.000 ljudi više od dvije godine. Za razliku od tipično istraživanje koje se fokusiralo na sudionike u vrijeme protesta, ex-post ploča dodaje 1) Podaci iz sudionicima prije i poslije događaja i 2) Podaci iz ne-sudionicima prije, za vrijeme i nakon natjecanja. Ovaj obogaćen struktura podataka omogućen Budak i Watts procijeniti što vrste ljudi su više vjerojatno da će sudjelovati u Gezi prosvjede i za procjenu promjena u stavovima sudionika i ne-sudionicima, kako u kratkom roku (uspoređujući prethodno Gezi na vrijeme Gezi) i dugoročno (uspoređujući prethodno Gezi na post-Gezi).

Slika 2.1: Dizajn koriste Budak and Watts (2015) za proučavanje Occupy Gezi prosvjedima u Turskoj, u ljeto 2013. godine Korištenjem uvijek na prirodu Twitter, istraživači su stvorili ono što se zove ex-post ploču koja je uključivala oko 30.000 ljudi više od dvije godine. Za razliku od tipično istraživanje koje se fokusiralo na sudionike u vrijeme protesta, ex-post ploča dodaje 1) Podaci iz sudionicima prije i poslije događaja i 2) Podaci iz ne-sudionicima prije, za vrijeme i nakon natjecanja. Ovaj obogaćen struktura podataka omogućen Budak i Watts procijeniti što vrste ljudi su više vjerojatno da će sudjelovati u Gezi prosvjede i za procjenu promjena u stavovima sudionika i ne-sudionicima, kako u kratkom roku (uspoređujući prethodno Gezi na vrijeme Gezi) i dugoročno (uspoređujući prethodno Gezi na post-Gezi).

Istina je da su neki od tih procjena mogla biti donesena bez uvijek na izvore prikupljanja podataka (npr dugoročne procjene promjene stava), iako je prikupljanje takvih podataka za 30.000 ljudi bi bili vrlo skupo. A, čak i daje neograničen proračun, ne mogu se sjetiti bilo koji drugi način da se u suštini omogućuje istraživačima da putuju natrag u vrijeme i neposredno promatrati sudionike ponašanje u prošlosti. Najbliže Alternativa bi bila da prikuplja retrospektivne izvješća o ponašanju, ali ta izvješća će biti ograničene preciznosti i upitne točnosti. Tablica 2.1 nudi i druge primjere studija koje koristite uvijek na izvoru podataka za proučavanje neočekivani događaj.

Tablica 2.1: Studije neočekivanih događaja koji koriste uvijek na velikim izvorima podataka.
Neočekivani događaj Uvijek se na podacima izvor Citat
Occupy Gezi pokret u Turskoj Cvrkut Budak and Watts (2015)
Kišobran prosvjedi u Hong Kongu Weibo Zhang (2016)
Pucnjava u policiji u New Yorku Stop-and-Frisk izvješća Legewie (2016)
Osoba pridružio ISIS Cvrkut Magdy, Darwish, and Weber (2016)
11. rujna 2001 napada livejournal.com Cohn, Mehl, and Pennebaker (2004)
11. rujna 2001 napada pager poruke Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Drugo, uvijek na prikupljanje podataka omogućuje istraživačima da proizvode u stvarnom vremenu mjerenja, što može biti važno u postavkama gdje kreatori politike žele ne samo učiti od postojećeg ponašanja, ali i odgovoriti na njega. Na primjer, društveni mediji podaci se mogu koristiti za usmjeravanje odgovora na prirodne katastrofe (Castillo 2016) .

U zaključku, uvijek na podacima sustavi omogućuju istraživačima da proučavaju neočekivanih događaja i pružiti podatke u stvarnom vremenu političarima. Nisam, međutim, predlaže da je uvijek na podacima sustavi omogućuju istraživačima za praćenje promjena tijekom dugog vremenskog razdoblja. To je zato što mnogi veliki sustavi podataka stalno se mijenjaju-procesu koji se zove nanos (odjeljak 2.3.2.4).