2.3.1.2 Alltaf-á

Alltaf-á stórum gögnum gerir rannsókn á óvæntum atburðum og rauntíma mælingar.

Mörg stór gögn kerfi eru alltaf-á; þeir eru stöðugt að safna gögnum. Þetta alltaf-á einkennandi veitir vísindamönnum með langsniðsgögnum (þ.e. gögn með tímanum). Vera alltaf-á hefur tvö mikilvæg áhrif á rannsóknir.

First, alltaf-á gögnum safn gerir vísindamönnum kleift að rannsaka óvænta atburði á þann hátt sem voru ekki mögulegt áður. Til dæmis, vísindamenn sem hafa áhuga á að læra hernema Gezi mótmæli í Tyrklandi í sumarið 2013 hefði yfirleitt áherslu á hegðun mótmælenda á meðan the atburður. Ceren Budak og Duncan Watts (2015) gátu gert meira með því að nota alltaf-á eðli Twitter að rannsaka Twitter-nota mótmælendur áður, á meðan og eftir atburðinn. Og þeir gátu til að búa til samanburð hóp erlendra þátttakenda (eða þátttakendur sem ekki kvak um mótmæli) áður, á meðan og eftir atburði (Mynd 2.1). Alls fyrrverandi staða þeirra spjaldið ma kvak af 30.000 manns á tveimur árum. Með eflingu almennt notuð gögn frá mótmælunum með þessum aðrar upplýsingar, Budak og Watts voru fær um að læra miklu meira: þeir gátu til að meta hvers konar fólk voru líklegri til að taka þátt í Gezi mótmæli og að meta breytingar í viðhorfum þátttakendur og erlendir þátttakendur, bæði til skamms tíma (samanburður fyrirfram Gezi að á Gezi) og til lengri tíma litið (samanburður fyrirfram Gezi að senda-Gezi).

Mynd 2.1: Hönnun notað af Budak og Watts (2015) til að rannsaka hernema Gezi mótmæli í Tyrklandi í sumar 2013. Með því að nota alltaf-á eðli Twitter, sem vísindamenn búið það sem þeir kallast fyrrverandi staða spjaldið sem fylgir um 30.000 manns á tveimur árum. Öfugt dæmigerður rannsókn sem lagt áherslu á þátttakendur á mótmæli, fyrrverandi staða spjaldið bætir 1) gögn frá þátttakendum fyrir og eftir atburði og 2) gögn frá erlendum þátttakendum áður, á meðan og eftir atburðinn. Þetta auðgað gögn uppbygging virkt Budak og Watts að meta hvers konar fólk voru líklegri til að taka þátt í Gezi mótmæli og að meta breytingar í viðhorfum þátttakenda og erlendra þátttakenda, bæði til skamms tíma (samanburður fyrirfram Gezi að á Gezi) og til lengri tíma litið (samanburður pre-Gezi að senda-Gezi).

Mynd 2.1: Hönnun notað af Budak and Watts (2015) til að rannsaka hernema Gezi mótmæli í Tyrklandi í sumar 2013. Með því að nota alltaf-á eðli Twitter, sem vísindamenn búið það sem þeir kallast fyrrverandi staða spjaldið sem fylgir um 30.000 manns á tveimur árum. Öfugt dæmigerður rannsókn sem lagt áherslu á þátttakendur á mótmæli, fyrrverandi staða spjaldið bætir 1) gögn frá þátttakendum fyrir og eftir atburði og 2) gögn frá erlendum þátttakendum áður, á meðan og eftir atburðinn. Þetta auðgað gögn uppbygging virkt Budak og Watts að meta hvers konar fólk voru líklegri til að taka þátt í Gezi mótmæli og að meta breytingar í viðhorfum þátttakenda og erlendra þátttakenda, bæði til skamms tíma (samanburður fyrirfram Gezi að á Gezi) og til lengri tíma litið (samanburður pre-Gezi að senda-Gezi).

Það er satt að sumir af þessum áætlunum hefði verið gert án þess að alltaf-á gagnasöfnun heimildum (td langtíma áætlanir um viðhorf breytast), þó söfnun fyrir 30.000 manns slík gögn hefðu verið alveg dýr. Og, jafnvel gefið í ótakmarkaðan fjárhagsáætlun, ég get ekki hugsað um önnur aðferð sem gerir í raun vísindamenn að ferðast aftur í tímann og fylgjast beint þátttakendur hegðun í fortíðinni. Næst val væri að safna afturvirka skýrslur um hegðun, en þessar skýrslur væri takmörkuðu granularity og vafasama nákvæmni. Tafla 2.1 veitir önnur dæmi um rannsóknir sem nota alltaf-á gögn uppspretta til að rannsaka óvænt atburði.

Tafla 2.1: Rannsóknir á óvæntum atburðum með alltaf-á stórum gögnum heimildum.
óvænt viðburður Alltaf-á gögnum uppspretta Citation
Hernema Gezi hreyfingu í Tyrklandi twitter Budak and Watts (2015)
Umbrella mótmæli í Hong Kong Weibo Zhang (2016)
Shootings af lögreglu í New York Hættu-og-Frisk skýrslur Legewie (2016)
Sá liðs ISIS twitter Magdy, Darwish, and Weber (2016)
September 11, 2001 árás livejournal.com Cohn, Mehl, and Pennebaker (2004)
September 11, 2001 árás Friðþjófur skilaboð Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Í öðru lagi, alltaf-á gögnum safn gerir vísindamönnum kleift að framleiða rauntíma mælingar, sem getur verið mikilvægt í skólum þar sem stefna aðilar vilja ekki bara að læra af núverandi hegðun heldur einnig að bregðast við því. Til dæmis, félagsmiðlar gögn má nota til að leiðbeina viðbrögð við náttúruhamförum (Castillo 2016) .

Að lokum, alltaf-á gögnum kerfi gera vísindamönnum kleift að rannsaka óvænta atburði og veita rauntíma upplýsingar til stefnumótenda. Ég vissi hins vegar ekki að leggja til að það alltaf-á gögnum kerfi gera vísindamönnum kleift að fylgjast með breytingum á löngum tíma. Það er vegna þess að mörg stór gögn kerfi eru stöðugt að breytast-ferli sem kallast svíf (Hluti 2.3.2.4).