2.3.1.2 Kila mara

Kila mara data big itawezesha utafiti wa matukio zisizotarajiwa na halisi wakati kipimo.

Wengi mifumo kubwa data ni daima-on; wao ni daima kukusanya takwimu. Hii tabia ya daima-on hutoa watafiti na data longitudinal (yaani, data juu ya muda). Kuwa daima-on ina maana mbili muhimu kwa ajili ya utafiti.

Kwanza, daima-on ukusanyaji wa takwimu itawezesha watafiti kujifunza matukio yasiyotarajiwa kwa njia waliokuwa haiwezekani hapo awali. Kwa mfano, watafiti nia ya kusoma fanyeni biashara maandamano Gezi nchini Uturuki katika majira ya 2013 ingekuwa kawaida kuzingatia tabia ya waandamanaji wakati wa tukio hilo. Ceren Budak na Duncan Watts (2015) walikuwa na uwezo wa kufanya zaidi kwa kutumia asili daima-on wa Twitter kujifunza Twitter-kutumia waandamanaji kabla, wakati na baada ya tukio. Na, walikuwa na uwezo wa kujenga kulinganisha kundi la zisizo washiriki (au washiriki ambao hawakuwa tweet kuhusu maandamano) kabla, wakati na baada ya tukio (Kielelezo 2.1). Kwa jumla zamani baada yao jopo ni pamoja na tweets ya watu 30,000 katika kipindi cha miaka miwili. By augmenting data kawaida kutumika kutoka maandamano na habari hii mengine, Budak na Watts walikuwa na uwezo wa kujifunza mengi zaidi: waliweza kukadiria ni aina gani ya watu walikuwa zaidi uwezekano wa kushiriki katika maandamano Gezi na kukadiria mabadiliko katika mitizamo ya washiriki na mashirika yasiyo ya washiriki, katika muda mfupi (kulinganisha kabla ya Gezi kwa wakati Gezi) na katika muda mrefu (kulinganisha kabla ya Gezi baada-Gezi).

Kielelezo 2.1: Design kutumiwa na Budak na Watts (2015) kujifunza fanyeni biashara maandamano Gezi nchini Uturuki katika majira ya 2013. Kwa kutumia asili daima-on wa Twitter, watafiti umba kile walichokiita zamani baada ya jopo kuwa ni pamoja na kuhusu watu 30,000 katika kipindi cha miaka miwili. Kwa upande mwingine utafiti kawaida kwamba ililenga washiriki wakati wa maandamano, ex-post jopo anaongeza 1) data kutoka kwa washiriki kabla na baada ya tukio na 2) data kutoka mashirika yasiyo ya washiriki kabla, wakati na baada ya tukio. Hii data utajiri muundo kuwezeshwa Budak na Watts kukadiria ni aina gani ya watu walikuwa zaidi uwezekano wa kushiriki katika maandamano Gezi na kukadiria mabadiliko katika mitizamo ya washiriki na mashirika yasiyo ya washiriki, katika muda mfupi (kulinganisha kabla ya Gezi kwa wakati Gezi) na katika muda mrefu (kulinganisha kabla ya Gezi baada-Gezi).

Kielelezo 2.1: Design kutumiwa na Budak and Watts (2015) kujifunza fanyeni biashara maandamano Gezi nchini Uturuki katika majira ya 2013. Kwa kutumia asili daima-on wa Twitter, watafiti umba kile walichokiita zamani baada ya jopo kuwa ni pamoja na kuhusu watu 30,000 katika kipindi cha miaka miwili. Kwa upande mwingine utafiti kawaida kwamba ililenga washiriki wakati wa maandamano, ex-post jopo anaongeza 1) data kutoka kwa washiriki kabla na baada ya tukio na 2) data kutoka mashirika yasiyo ya washiriki kabla, wakati na baada ya tukio. Hii data utajiri muundo kuwezeshwa Budak na Watts kukadiria ni aina gani ya watu walikuwa zaidi uwezekano wa kushiriki katika maandamano Gezi na kukadiria mabadiliko katika mitizamo ya washiriki na mashirika yasiyo ya washiriki, katika muda mfupi (kulinganisha kabla ya Gezi kwa wakati Gezi) na katika muda mrefu (kulinganisha kabla ya Gezi baada-Gezi).

Ni kweli kwamba baadhi ya makadirio haya yangeweza kufanywa bila daima-on vyanzo ukusanyaji wa takwimu (mfano, makadirio ya muda mrefu ya mabadiliko ya tabia), ingawa ukusanyaji wa takwimu hizo kwa watu 30,000 ingekuwa ghali kabisa. Na, hata kupewa bajeti ukomo, siwezi kufikiria njia nyingine yoyote ambayo kimsingi inaruhusu watafiti kusafiri nyuma katika wakati na moja kwa moja kuchunguza washiriki tabia katika siku za nyuma. karibu mbadala itakuwa kukusanya taarifa retrospective ya tabia, lakini taarifa hizo itakuwa ya granularity mdogo na kuhojiwa usahihi. Jedwali 2.1 hutoa mifano mingine ya masomo ya kwamba matumizi ya daima-juu ya chanzo data kujifunza tukio zisizotarajiwa.

Jedwali 2.1: Mafunzo ya matukio yasiyotarajiwa kwa kutumia daima-on vyanzo kubwa data.
tukio isiyotarajiwa Kila mara data chanzo citation
Anashughulika Gezi harakati katika Uturuki Twitter Budak and Watts (2015)
maandamano mwavuli katika Hong Kong Weibo Zhang (2016)
Shootings wa polisi katika jiji la New York Kuacha-na-frisk ripoti Legewie (2016)
Mtu kujiunga na ISIS Twitter Magdy, Darwish, and Weber (2016)
Septemba 11, 2001 mashambulizi livejournal.com Cohn, Mehl, and Pennebaker (2004)
Septemba 11, 2001 mashambulizi ujumbe pager Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Pili, daima-on ukusanyaji wa takwimu itawezesha watafiti wa kuzalisha vipimo halisi wakati, ambayo inaweza kuwa muhimu katika mazingira ambapo watunga sera wanataka si tu kujifunza kutokana na tabia iliyopo lakini pia kujibu hilo. Kwa mfano, data kijamii vyombo vya habari inaweza kutumika kuongoza majibu ya majanga ya asili (Castillo 2016) .

Kwa kumalizia, daima-on data mifumo kuwawezesha watafiti kujifunza matukio yasiyotarajiwa na kutoa halisi wakati habari kwa watunga sera. Sikuwa, hata hivyo, kupendekeza kwamba kwamba daima-on data mifumo kuwawezesha watafiti kufuatilia mabadiliko juu ya muda mrefu. Hayo ni kwa sababu wengi mifumo kubwa data ni kubadilika-mchakato kuitwa drift (Sehemu ya 2.3.2.4).