2.3.2.4 Drifting

Idadi ya watu drift, matumizi drift, na mfumo wa drift kufanya ni vigumu kutumia data kubwa chanzo kujifunza mwenendo wa muda mrefu.

Moja ya faida kubwa ya vyanzo vingi big data ni kwamba wao kukusanya takwimu juu ya muda. wanasayansi ya jamii kuwaita aina hii ya data juu ya muda, data longitudinal. Na, asili, data longitudinal ni muhimu sana kwa ajili ya kusoma mabadiliko. Ili reliably kupima mabadiliko, hata hivyo, kipimo mfumo yenyewe lazima kuwa imara. Kwa maneno ya mwanasosholojia Otis Dudley Duncan, "kama unataka kupima mabadiliko, si mabadiliko ya kipimo" (Fischer 2011) .

Kwa bahati mbaya, wengi data big mifumo-hasa mfumo wa biashara kwamba kuunda na kukamata digital athari-yanabadilika wakati wote, mchakato kwamba Mimi nitakuita drift. Hasa, mifumo hii kubadilika kwa njia kuu tatu: idadi ya watu drift (mabadiliko katika ambaye ni kutumia yao), kitabia drift (mabadiliko katika jinsi watu ni kutumia yao), na mfumo wa drift (mabadiliko katika mfumo yenyewe). vyanzo tatu ya drift maana kwamba yoyote mfano katika data digital kuwaeleza inaweza kusababishwa na mabadiliko muhimu katika dunia, au inaweza kuwa unasababishwa na baadhi ya fomu ya drift.

chanzo cha kwanza drift-idadi ya watu drift-ni ambaye ni kutumia mfumo, na hii mabadiliko katika mizani muda mrefu na mizani ya muda mfupi. Kwa mfano, kutoka 2008 hadi sasa umri wa wastani wa watu juu ya kijamii vyombo vya habari imeongezeka. Mbali na mwenendo haya ya muda mrefu, watu kutumia mfumo wakati wowote inatofautiana. Kwa mfano, wakati wa uchaguzi Marekani Rais wa mwaka 2012 uwiano wa tweets kuhusu siasa kwamba ziliandikwa na wanawake zilishuka kutoka siku hadi siku (Diaz et al. 2016) . Hivyo, nini kinaweza kuonekana kuwa mabadiliko katika mood ya Twitter mstari ili kweli tu kuwa mabadiliko katika ambaye ni kuzungumza wakati wowote.

Mbali na mabadiliko katika ambaye ni kutumia mfumo, kuna pia mabadiliko katika jinsi mfumo ni kutumika. Kwa mfano, wakati the fanyeni biashara Gezi Park maandamano katika Istanbul, Uturuki mwaka 2013 waandamanaji iliyopita matumizi yao ya hashtags kama maandamano tolewa. Hapa ni jinsi gani Zeynep Tufekci (2014) alieleza drift, ambayo yeye alikuwa na uwezo wa kuchunguza sababu yeye alikuwa kuchunguza tabia juu ya Twitter na juu ya ardhi:

"Kilichotokea ni kwamba haraka kama maandamano akawa hadithi kubwa, idadi kubwa ya watu. . . kusimamishwa kwa kutumia hashtags isipokuwa kuteka makini na jambo jipya. . .. Wakati maandamano kuendelea, na hata ulizidi, hashtags alikufa chini. Mahojiano umebaini sababu mbili kwa hili. Kwanza, mara moja kila mtu alijua mada, hashtag alikuwa mara moja chepesi na fujo juu ya tabia-mdogo Twitter jukwaa. Pili, hashtags walikuwa kuonekana tu kama muhimu kwa ajili ya kuvutia na mada fulani, si kwa kuzungumza kuhusu suala hilo. "

Hivyo, watafiti ambao walikuwa kusoma maandamano na kuchambua tweets na hashtags maandamano yanayohusiana na ingekuwa maana potofu ya nini kinatokea kwa sababu ya drift hii tabia. Kwa mfano, wapate kuamini kwamba mjadala wa maandamano ilipungua kwa muda mrefu kabla ni kweli kupungua.

aina ya tatu ya drift ni mfumo drift. Katika kesi hiyo, siyo watu kubadilisha au tabia kubadilisha yao, lakini mfumo yenyewe kubadilika. Kwa mfano, baada ya muda Picha imeongezeka kikomo juu ya urefu wa hali ya updates. Hivyo, yeyote utafiti longitudinal ya hali ya updates itakuwa mazingira magumu na mabaki unasababishwa na mabadiliko hayo. System drift ni karibu kuhusiana na tatizo aitwaye algorithmic confounding ambayo sisi sasa kurejea.