2.3.2 Daima

Kila mara data big itawezesha utafiti wa matukio zisizotarajiwa na halisi wakati kipimo.

Wengi mifumo kubwa data ni daima-on; wao ni daima kukusanya takwimu. Hii tabia ya daima-on hutoa watafiti na data longitudinal (yaani, data juu ya muda). Kuwa daima-on ina maana mbili muhimu kwa ajili ya utafiti.

Kwanza, daima kwenye ukusanyaji wa data huwezesha watafiti kujifunza matukio zisizotarajiwa kwa njia ambazo haingewezekana. Kwa mfano, watafiti wenye nia ya kusoma maandamano ya Occupy Gezi nchini Uturuki katika majira ya joto ya 2013 ingekuwa kawaida kuzingatia tabia ya waandamanaji wakati wa tukio. Ceren Budak na Duncan Watts (2015) waliweza kufanya zaidi kwa kutumia asili ya kila siku ya Twitter kujifunza waandamanaji ambao walitumia Twitter kabla, wakati, na baada ya tukio hilo. Na, walikuwa na uwezo wa kuunda kikundi cha kulinganisha cha wasio na sehemu kabla, wakati, na baada ya tukio (takwimu 2.2). Kwa jumla, jopo lao la zamani lilijumuisha tweets ya watu 30,000 zaidi ya miaka miwili. Kwa kuongezeka kwa data ya kawaida inayotumiwa kutoka kwa maandamano na maelezo mengine haya, Budak na Watts waliweza kujifunza mengi zaidi: waliweza kukadiria ni aina gani ya watu ambao walikuwa zaidi ya kushiriki katika maandamano ya Gezi na kukadiria mabadiliko katika mtazamo wa washiriki na wasiokuwa wahusika, kwa muda mfupi (kulinganisha kabla ya Gezi hadi wakati wa Gezi) na kwa muda mrefu (kulinganisha kabla ya Gezi na baada ya Gezi).

Mchoro 2.2: Uundo uliotumiwa na Budak na Watts (2015) kujifunza maandamano ya Occupy Gezi nchini Uturuki wakati wa majira ya joto ya mwaka 2013. Kwa kutumia asili ya kila siku ya Twitter, watafiti waliunda kile walichokiita jopo la zamani ambalo lilijumuisha kuhusu Watu 30,000 zaidi ya miaka miwili. Kinyume na utafiti wa kawaida uliozingatia washiriki wakati wa maandamano, jopo la baada ya chapisho linaongezea 1) data kutoka kwa washiriki kabla na baada ya tukio hilo na 2) data kutoka kwa wasiojiunga kabla, wakati, na baada ya tukio hilo. Hii imetengeneza muundo wa data iliwezesha Budak na Watts kukadiria ni aina gani ya watu ambao walikuwa zaidi ya kushiriki katika maandamano ya Gezi na kukadiria mabadiliko katika mtazamo wa washiriki na wasio washiriki, wote kwa muda mfupi (kulinganisha kabla ya Gezi na wakati wa Gezi ) na kwa muda mrefu (kulinganisha kabla ya Gezi na baada ya Gezi).

Mchoro 2.2: Uundo uliotumiwa na Budak and Watts (2015) kujifunza maandamano ya Occupy Gezi nchini Uturuki wakati wa majira ya joto ya mwaka 2013. Kwa kutumia asili ya kila siku ya Twitter, watafiti waliunda kile walichokiita jopo la zamani ambalo lilijumuisha kuhusu Watu 30,000 zaidi ya miaka miwili. Kinyume na utafiti wa kawaida uliozingatia washiriki wakati wa maandamano, jopo la baada ya chapisho linaongezea 1) data kutoka kwa washiriki kabla na baada ya tukio hilo na 2) data kutoka kwa wasiojiunga kabla, wakati, na baada ya tukio hilo. Hii imetengeneza muundo wa data iliwezesha Budak na Watts kukadiria ni aina gani ya watu ambao walikuwa zaidi ya kushiriki katika maandamano ya Gezi na kukadiria mabadiliko katika mtazamo wa washiriki na wasio washiriki, wote kwa muda mfupi (kulinganisha kabla ya Gezi na wakati wa Gezi ) na kwa muda mrefu (kulinganisha kabla ya Gezi na baada ya Gezi).

Skeptic inaweza kuonyesha kuwa baadhi ya makadirio hayo yanaweza kufanywa bila ya kila siku-kwenye vyanzo vya kukusanya data (kwa mfano, makadirio ya muda mrefu ya mabadiliko ya tabia), na hiyo ni sahihi, ingawa ukusanyaji wa data kama watu 30,000 ungekuwa kabisa ghali. Hata kupewa bajeti isiyo na ukomo, hata hivyo, siwezi kufikiria njia yoyote ambayo inaruhusu watafiti kurudi nyuma kwa muda na kuchunguza tabia ya washiriki katika siku za nyuma. Njia mbadala ya karibu itakuwa kukusanya ripoti ya retrospective ya tabia, lakini ripoti hizi zitakuwa na upepesi mdogo na usahihi. meza 2.1 hutoa mifano mingine ya tafiti ambazo hutumia chanzo cha data kila wakati ili kujifunza tukio lisilozotarajiwa.

Jedwali 2.1: Uchunguzi wa matukio zisizotarajiwa kutumia vyanzo vingi vya data daima.
Tukio zisizotarajiwa Daima kwenye chanzo cha data Citation
Kufanya kazi kwa Gezi harakati nchini Uturuki Twitter Budak and Watts (2015)
Maandamano ya maandamano huko Hong Kong Weibo Zhang (2016)
Kupigwa kwa polisi huko New York City Ripoti za kuacha-na-frisk Legewie (2016)
Mtu kujiunga na ISIS Twitter Magdy, Darwish, and Weber (2016)
Septemba 11, 2001 mashambulizi livejournal.com Cohn, Mehl, and Pennebaker (2004)
Septemba 11, 2001 mashambulizi ujumbe wa pager Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Mbali na kusoma matukio yasiyotarajiwa, daima kwenye mifumo ya data kubwa pia huwawezesha watafiti kuzalisha makadirio ya muda halisi, ambayo inaweza kuwa muhimu katika mipangilio ambapo watunga sera-katika serikali au sekta-wanataka kujibu kulingana na ufahamu wa hali. Kwa mfano, data za vyombo vya habari zinaweza kutumika kuongoza majibu ya dharura kwa majanga ya asili (Castillo 2016) na vyanzo mbalimbali vya data kubwa vinaweza kutumiwa kutoa makadirio ya muda halisi ya shughuli za kiuchumi (Choi and Varian 2012) .

Kwa kumalizia, daima-juu ya mifumo ya data huwezesha watafiti kujifunza matukio zisizotarajiwa na kutoa taarifa halisi ya muda kwa watunga sera. Hata hivyo, sifikiri kwamba daima-juu ya mifumo ya data inafaa kwa kufuatilia mabadiliko kwa muda mrefu sana. Hiyo ni kwa sababu mifumo mingi ya data inabadilika mara kwa mara-mchakato ambao nitaita simulizi baadaye katika sura (kifungu 2.3.7).