2.3.2 Aina päällä

Aina päällä iso data voidaan tutkia odottamattomien tapahtumien ja reaaliaikainen mittaus.

Monet suuret tietojärjestelmät ovat aina päällä; ne ovat jatkuvasti kerätä tietoja. Tämä aina päällä ominaisuus antaa tutkijoille pitkittäisleikkaustiedoista (eli data ajan). Koska aina päällä on kaksi merkittäviä vaikutuksia tutkimukseen.

Ensinnäkin aina kerätyn tiedonkeruun avulla tutkijat voivat tutkia odottamattomia tapahtumia tavalla, joka ei muuten olisi mahdollista. Esimerkiksi tutkijat, jotka ovat kiinnostuneita miehittämään Gezi-mielenosoituksia Turkissa kesällä 2013, keskittyvät tyypillisesti mielenosoittajien käyttäytymiseen tapahtuman aikana. Ceren Budak ja Duncan Watts (2015) pystyivät tekemään enemmän käyttämällä Twitterin jatkuvan luonteen tutkiakseen mielenosoittajia, jotka käyttivät Twitteriä ennen tapahtumaa, sen aikana ja sen jälkeen. Ja he pystyivät luomaan vertailuryhmän, joka ei osallistu osallistumaan ennen tapahtumaa, sen aikana ja sen jälkeen (kuva 2.2). Kaiken kaikkiaan niiden ex-post paneeli sisälsi tweetit 30 000 ihmistä yli kaksi vuotta. Lisättämällä prototyyppejä yleisesti käytetyillä tiedoilla tämän muun tiedon kanssa Budak ja Watts oppivat paljon enemmän: he pystyivät arvioimaan, millaisia ​​ihmisiä todennäköisemmin osallistui Gezi-protesteihin ja arvioimaan muutosten asenteita (vertaamalla pre-Geziä Geziin aikana) ja pitkällä aikavälillä (vertaamalla pre-Gezi ja Gezi-jälkeistä aikaa).

Kuva 2.2: Budakin ja Wattsin (2015) käyttämä muotoilu, jonka tarkoituksena on tutkia Occupy Gezien mielenosoituksia Turkissa kesällä 2013. Käyttämällä visuaalisen Twitterin jatkuvan luonteen tutkijoita luotiin mitä he kutsuivat ex-post-paneeliksi, 30 000 ihmistä yli kaksi vuotta. Päinvastoin kuin tyypillinen tutkimus, joka keskittyi osallistujien aikana protestit, ex-post paneeli lisää 1) tietoja osallistujista ennen ja jälkeen tapahtuman ja 2) tiedot muiden kuin osallistujat ennen, aikana ja sen jälkeen tapahtuman. Tämän rikastetun tietorakenteen ansiosta Budak ja Watts arvioivat, minkälaiset ihmiset todennäköisemmin osallistuivat Gezi-protesteihin ja arvioivat osallistujien ja muiden kuin osallistuvien asenteiden muutoksia lyhyellä aikavälillä (vertaamalla pre-Geziä Geziin aikana ) ja pitkällä aikavälillä (vertaamalla pre-Geziin ja Geziin jälkeiseen aikaan).

Kuva 2.2: Budak and Watts (2015) käyttämä muotoilu, jonka tarkoituksena on tutkia Occupy Gezien mielenosoituksia Turkissa kesällä 2013. Käyttämällä visuaalisen Twitterin jatkuvan luonteen tutkijoita luotiin mitä he kutsuivat ex-post-paneeliksi , 30 000 ihmistä yli kaksi vuotta. Päinvastoin kuin tyypillinen tutkimus, joka keskittyi osallistujien aikana protestit, ex-post paneeli lisää 1) tietoja osallistujista ennen ja jälkeen tapahtuman ja 2) tiedot muiden kuin osallistujat ennen, aikana ja sen jälkeen tapahtuman. Tämän rikastetun tietorakenteen ansiosta Budak ja Watts arvioivat, minkälaiset ihmiset todennäköisemmin osallistuivat Gezi-protesteihin ja arvioivat osallistujien ja muiden kuin osallistuvien asenteiden muutoksia lyhyellä aikavälillä (vertaamalla pre-Geziä Geziin aikana ) ja pitkällä aikavälillä (vertaamalla pre-Geziin ja Geziin jälkeiseen aikaan).

Skeptikko voisi huomauttaa, että jotkin näistä arvioista olisi voitu tehdä ilman aina tietoja kerättäviä lähteitä (esim. Pitkän aikavälin asenteiden muutoksen arvioita) ja tämä on oikein, vaikka tällainen tiedonkeruu 30 000 ihmiselle olisi ollut varsin kallis. Jopa rajatun budjetin ansiosta en voi ajatella mitään muuta menetelmää, joka antaa tutkijoille mahdollisuuden matkustaa ajassa taaksepäin ja tarkkailla suoraan osanottajien käyttäytymistä aiemmin. Lähin vaihtoehto olisi kerätä takautuvia raportteja käyttäytymisestä, mutta nämä raportit olisivat rajatun rakeisuuden ja kyseenalainen tarkkuus. Taulukossa 2.1 on muita esimerkkejä tutkimuksista, joissa käytetään jatkuvasti tietolähdettä odottamattoman tapahtuman tutkimiseen.

Taulukko 2.1: Odottamattomien tapahtumien tutkimukset käyttäen aina suuria tietolähteitä.
Odottamaton tapahtuma Aina päällä oleva tietolähde lainaus
Tartu Gezi-liikkeeseen Turkissa Viserrys Budak and Watts (2015)
Umbrella protestoi Hongkongissa Weibo Zhang (2016)
Poliisitapaukset New Yorkissa Stop-ja-frisk raportteja Legewie (2016)
ISISiin liittyminen Viserrys Magdy, Darwish, and Weber (2016)
11. syyskuuta 2001 hyökkäys livejournal.com Cohn, Mehl, and Pennebaker (2004)
11. syyskuuta 2001 hyökkäys hakulaitteen viestejä Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Yhä odottamattomien tapahtumien tutkimisen lisäksi isojen tietojärjestelmien ansiosta tutkijat voivat tuottaa reaaliaikaisia ​​arvioita, jotka voivat olla tärkeitä asetuksissa, joissa päättäjät - hallituksessa tai teollisuudessa - haluavat vastata tilannetietoisuuden perusteella. Esimerkiksi sosiaalisen median tietoja voidaan käyttää ohjaamaan luonnonkatastrofien hätätilanteita (Castillo 2016) ja erilaisia ​​suuria tietolähteitä voidaan tuottaa reaaliaikaisia ​​taloudellisia vaikutuksia koskevia arvioita (Choi and Varian 2012) .

Yhteenvetona tietojärjestelmien avulla tutkijat voivat tutkia odottamattomia tapahtumia ja antaa reaaliaikaista tietoa päätöksentekijöille. En kuitenkaan usko, että jatkuvat tietojärjestelmät sopivat hyvin muutosten seuraamiseen hyvin pitkiä aikoja. Tämä johtuu siitä, että monet suuret tietojärjestelmät ovat jatkuvasti muuttumassa - prosessi, jota kutsun ajelehtimiseksi myöhemmin luvussa 2.3.7.