2.3.2 Alltaf á

Alltaf-á stórum gögnum gerir rannsókn á óvæntum atburðum og rauntíma mælingar.

Mörg stór gögn kerfi eru alltaf-á; þeir eru stöðugt að safna gögnum. Þetta alltaf-á einkennandi veitir vísindamönnum með langsniðsgögnum (þ.e. gögn með tímanum). Vera alltaf-á hefur tvö mikilvæg áhrif á rannsóknir.

Í fyrsta lagi gerir alltaf vísindamenn kleift að kynna óvæntar viðburði á þann hátt sem annars væri ekki hægt. Til dæmis, vísindamenn sem hafa áhuga á að læra hernema Gezi mótmælin í Tyrklandi sumarið 2013 myndi venjulega einbeita sér að hegðun mótmælenda meðan á viðburðinum stendur. Ceren Budak og Duncan Watts (2015) voru fær um að gera meira með því að nota alltaf á eðli Twitter til að kynna mótmælendur sem notuðu Twitter áður, á meðan og eftir atburðinn. Og þeir gátu búið til samanburðarhóp þátttakenda áður en, meðan og eftir atburðinn (mynd 2.2). Alls fyrrverandi staða þeirra spjaldið með kvak um 30.000 manns á tveimur árum. Með því að auka almennt notaðar gögn frá mótmælunum með þessum öðrum upplýsingum, voru Budak og Watts fær um að læra mikið meira: þeir gátu metið hvaða líkur voru líklegri til að taka þátt í Gezi mótmælunum og meta breytingar á viðhorfum þátttakendur og ekki þátttakendur, bæði til skamms tíma (samanburður á Gezi á Gezi) og til lengri tíma litið (samanburður fyrir Gezi með Post-Gezi).

Mynd 2.2: Hönnun sem notuð er af Budak og Watts (2015) til að rannsaka hernema Gezi mótmælin í Tyrklandi sumarið 2013. Með því að nota alltaf á eðli Twitter, skapaði vísindamenn það sem þeir kallaðu eftirpóstborð sem fylgdi um 30.000 manns yfir tvö ár. Í mótsögn við dæmigerð rannsókn sem var lögð áhersla á þátttakendur meðan á mótmælunum stóð, bætir utanaðkomandi spjaldið 1) gögn frá þátttakendum fyrir og eftir atburðinn og 2) gögn frá þátttakendum fyrir, meðan og eftir atburðinn. Þessi auðgaða uppbygging gagnvaði Budak og Watts til að meta hvers konar líkur voru líklegri til að taka þátt í Gezi mótmælunum og meta breytingar á viðhorfum þátttakenda og þátttakenda, bæði til skamms tíma (samanburður á Gezi með Gezi ) og til lengri tíma litið (samanburður pre-Gezi með eftir Gezi).

Mynd 2.2: Hönnun sem notuð er af Budak and Watts (2015) til að rannsaka hernema Gezi mótmælin í Tyrklandi sumarið 2013. Með því að nota alltaf á eðli Twitter, skapaði vísindamenn það sem þeir kallaðu eftirpóstborð sem fylgdi um 30.000 manns yfir tvö ár. Í mótsögn við dæmigerð rannsókn sem var lögð áhersla á þátttakendur meðan á mótmælunum stóð, bætir utanaðkomandi spjaldið 1) gögn frá þátttakendum fyrir og eftir atburðinn og 2) gögn frá þátttakendum fyrir, meðan og eftir atburðinn. Þessi auðgaða uppbygging gagnvaði Budak og Watts til að meta hvers konar líkur voru líklegri til að taka þátt í Gezi mótmælunum og meta breytingar á viðhorfum þátttakenda og þátttakenda, bæði til skamms tíma (samanburður á Gezi með Gezi ) og til lengri tíma litið (samanburður pre-Gezi með eftir Gezi).

Efasemdamaður kann að benda á að sumar þessar áætlanir gætu verið gerðar án ávallt gagnasöfnunar (td langtímaáætlanir um breytingar á viðhorfum) og það er rétt, þó að slík gagnasöfnun fyrir 30.000 manns hefði verið alveg dýrt. Jafnvel gefið ótakmarkaðan fjárhagsáætlun, en ég get ekki hugsað um neina aðra aðferð sem gerir vísindamenn í raun kleift að ferðast aftur í tímann og fylgjast beint með hegðun þátttakenda í fortíðinni. Næst val væri að safna afturvirkum skýrslum um hegðun en þessar skýrslur myndu vera af skornum skammti og vafasama nákvæmni. Tafla 2.1 gefur til kynna aðrar dæmi um rannsóknir sem nota ávallt gagnasöfn til að kynna óvæntar atburði.

Tafla 2.1: Rannsóknir á óvæntum atburðum sem nota alltaf stórar gagnasöfnanir.
Óvænt atburður Alltaf á gagnasafni Tilvitnun
Hernema Gezi hreyfing í Tyrklandi Twitter Budak and Watts (2015)
Umbrots mótmæli í Hong Kong Weibo Zhang (2016)
Skotleikir lögreglu í New York City Hætta-og-frisk skýrslur Legewie (2016)
Persónulegur þátttakandi í ISIS Twitter Magdy, Darwish, and Weber (2016)
11. september 2001 árás livejournal.com Cohn, Mehl, and Pennebaker (2004)
11. september 2001 árás skilaboðum skilaboðum Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Auk þess að læra óvæntar viðburði gerir alltaf vísindamenn kleift að framleiða rauntíma áætlanir sem geta verið mikilvægar í stillingum þar sem stefnumótendur - í ríkisstjórn eða iðnaði - vilja bregðast við með hliðsjón af staðbundinni vitund. Til dæmis er hægt að nota félagsleg gögn til að leiðbeina neyðarviðbrögðum við náttúruhamförum (Castillo 2016) og margs konar stórum gögnum sem hægt er að nota framleiða rauntíma mat á atvinnustarfsemi (Choi and Varian 2012) .

Niðurstaðan er sú að alltaf-á gagna kerfi gerir vísindamenn kleift að kynna óvæntar viðburði og veita rauntíma upplýsingar til stefnumótandi aðila. Ég held hins vegar ekki á því að ávallt gagnasöfn séu vel til þess að fylgjast með breytingum á mjög langan tíma. Það er vegna þess að mörg stórar gagnakerfi eru stöðugt að breytast - ferli sem ég mun kalla svíf síðar í kafla (kafla 2.3.7).