2.3.2 Beti-on

Beti-orrian datuak big ustekabeko gertaerak eta denbora errealeko neurketa aztertu ahal.

Big datuak sistema asko daude beti-on; dute datuak etengabe jasotzen ari. beti-on Ezaugarri hori datu luzetarako dituzten ikertzaileei eskaintzen da (hau da, datuak denboran zehar). beti-on izatea ikerketarako bi inplikazio garrantzitsuak ditu.

Lehenik eta behin, datuen bilketarako beti aukera ematen du ikertzaileek ustekabeko gertaerak ikertzeko, bestela ezingo luketen moduan. Adibidez, Turkiako Occupy Gezi protestak 2013ko udan aztertzeko interesa duten ikertzaileek normalean ekitaldian protestanteen jokabidea izango lukete. Ceren Budakek eta Duncan Watts-ek (2015) gehiago egin ahal izan zuten Twitterren izaera beti erabiltzen dutenak, aurretik, zehar eta ondorengoak Twitter erabiltzen zituztenak. Eta parte-hartzaileen arteko konparazio-talde bat sortu ahal izan zuten gertaera baino lehen, zehar eta ondoren (2.2. Irudia). Guztira, 30 hilabete baino gehiagoko tweetek ex-post panelek bi urte baino gehiago daramatzate. Protokoloek beste informazio horrekin erabilitako datuak handituz gero, Budak eta Watts-ek askoz ere gehiago ikasi ahal izan zuten: Gezi-ren protestak zein motatakoak izan ziren eta norberaren jarreretan aldaketak kalkulatzeko gai ziren. parte-hartzaileak eta parte-hartzaileak, bai epe laburrean (pre-Gezi Gezi zehar alderatuz) eta epe luzera (pre-Gezi post Gezi alderatuz).

2.2 irudia: Budak eta Watts-ek (2015) erabilitako diseinua, Turkian okupatu Gezi protestak 2013ko udan aztertzeko. Twitteren izaera beti erabiliz, ikertzaileek bertan sortu zuten panel ex post bat deitu zuten. 30.000 lagun bi urte baino gehiagoz. Protestetan zehar parte-hartzaileei zuzendutako azterketa tipikoarekin alderatuta, ex-post panelak 1) parte hartzen du parte-hartzaileen datuak aurretik eta ondoren, eta 2) parte-hartzaileen datuak aurretik, zehar, eta ondoren. Datuen egitura aberastu honek Budak eta Watts-ek Gezi protestaetan parte hartzeko aukera izan zuten eta parte-hartzaileen eta ez-parte hartzaileen jarreretan aldaketak kalkulatzeko, bai epe laburrean (pre-Gezi alderatuz Gezi zehar ) eta epe luzera (pre-Gezi-rekin post-Gezi-rekin alderatuz).

2.2 irudia: Budak and Watts (2015) erabilitako diseinua, Turkian okupatu Gezi protestak 2013ko udan aztertzeko. Twitteren izaera beti erabiliz, ikertzaileek bertan sortu zuten panel ex post bat deitu zuten. 30.000 lagun bi urte baino gehiagoz. Protestetan zehar parte-hartzaileei zuzendutako azterketa tipikoarekin alderatuta, ex-post panelak 1) parte hartzen du parte-hartzaileen datuak aurretik eta ondoren, eta 2) parte-hartzaileen datuak aurretik, zehar, eta ondoren. Datuen egitura aberastu honek Budak eta Watts-ek Gezi protestaetan parte hartzeko aukera izan zuten eta parte-hartzaileen eta ez-parte hartzaileen jarreretan aldaketak kalkulatzeko, bai epe laburrean (pre-Gezi alderatuz Gezi zehar ) eta epe luzera (pre-Gezi-rekin post-Gezi-rekin alderatuz).

Eszeptiko batek esaten duenez, estimazio horietako batzuk beti izan daitezke datuen bilketa-iturririk gabe (adibidez, jarrera aldaketaren epe luzerako kalkuluak), eta hori zuzena da, 30.000 lagunentzako datu-bilketa hori nahiko nahiko garestia. Nahiz eta aurrekontu mugagabea eman, ordea, ezin dut inolaz ere inolaz ere beste ikertzaile batzuek , denboran zehar bidaiatzeko eta zuzenean parte hartzaileen portaera behatzeko. Bestalde, portaera atzera begirakoaren txostenak biltzea nahiago izango litzateke, baina txosten horiek oso kopuru txikia eta zalantzazko zehaztasuna izango lirateke. 2.1 taulan datu esperimental bat erabiltzen duten ikasketen beste adibide batzuk eskaintzen dira ustekabeko gertaera ikertzera.

2.1 taulan: ustekabeko gertaeren azterketak, datu-iturri handiak beti erabiliz.
Ustekabeko gertaera Beti datu-iturburuan Citation
Okupatzen Gezi mugimendua Turkian Twitter Budak and Watts (2015)
Hong Kongeko parke protestak Weibo Zhang (2016)
Poliziak New Yorken Gelditu eta freskoa txostenak Legewie (2016)
ISISen sartuko pertsona Twitter Magdy, Darwish, and Weber (2016)
2001eko irailaren 11n erasoa livejournal.com Cohn, Mehl, and Pennebaker (2004)
2001eko irailaren 11n erasoa Pager mezuak Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Ustekabeko gertaerak aztertzeaz gain, beti ere datu-sistema handiek ere denbora errealean kalkulatzeko aukera ematen diete ikertzaileek, zeinek garrantzi handikoak izan daitezkeen erabakiak hartzerakoan, gobernuek edo industria-sektoreek egoera kontzientzian oinarritutako erantzuna eman nahi baitute. Adibidez, gizarte-komunikabideen datuak hondamendi naturalen larrialdi-erantzunari (Castillo 2016) gidatzeko erabil daitezke eta hainbat datu-iturri desberdin erabil daitezke jarduera ekonomikoan denbora errealean kalkulatzeko (Choi and Varian 2012) .

Azkenean, beti datu-sistemek ikertzaileek ustekabeko gertaerak ikasi eta denbora errealean informazioa ematen diete arduradunei. Hala eta guztiz ere, ez dut uste beti datu-sistemek oso egokiak direla denbora tarte osoetan aldaketak jarraitzeko. Hori dela eta, datu sistema handiak etengabe aldatzen ari dira (kapituluko kapituluan aurrerantzean deitzen diegun prozesua (2.3.7 atala).