2.3.7 Drifting

It-tifrix tal-popolazzjoni, it-tifrix tal-użu u t-tixrid tas-sistema jagħmluha diffiċli biex jintużaw sorsi kbar ta 'dejta biex jiġu studjati xejriet fit-tul.

Wieħed mill-vantaġġi kbar ta 'bosta sorsi ta' data kbar huwa li jiġbru d-dejta maż-żmien. Ix-xjenzjati soċjali jsejħu dan it-tip ta 'data lonġitudinali tad- data fuq żmien twil. U, naturalment, id-data lonġitudinali hija importanti ħafna għall-istudju tal-bidla. Sabiex titkejjel il-bidla b'mod affidabbli, madankollu, is-sistema tal-kejl innifisha għandha tkun stabbli. Skont il-kliem tas-soċjologu Otis Dudley Duncan, "jekk trid tkejjel il-bidla, ma tbiddilx il-miżura" (Fischer 2011) .

Sfortunatament, ħafna ta 'data kbar sistemi-speċjalment sistemi tal-huma negozju jinbidlu l-ħin kollu, l-proċess li I ser sejħa drift. B'mod partikolari, dawn is-sistemi jinbidlu fi tliet modi ewlenin: it -tifrix tal-popolazzjoni (bidla f'li min qed jużah), imġiba fl-imġiba (bidla fil-mod kif in-nies qed jużawhom), u t-tendenza tas-sistema (bidla fis-sistema nnifisha). It-tliet sorsi ta 'drift ifissru li kwalunkwe mudell f'sors ta' dejta kbir jista 'jkun ikkawżat minn bidla importanti fid-dinja, jew jista' jkun ikkawżat minn xi forma ta 'xkiel.

L-ewwel sors ta 'drift-drift tal-popolazzjoni huwa kkawżat minn bidliet f'liema qed juża s-sistema, u dawn il-bidliet jistgħu jiġru kemm fuq żmien qasir kif ukoll fuq tul ta' żmien twil. Pereżempju, matul l-elezzjoni Presidenzjali tal-2012 tal-2012, il-proporzjon ta 'tweets dwar il-politika li nkitbet min-nisa varja minn jum għal jum (Diaz et al. 2016) . Għalhekk, x'jista 'jidher li jkun hemm bidla fil-burdata tal-poeżiji Twitter jista' fil-fatt ikun biss bidla f'liema qed titkellem f'xi mument. Minbarra dawn iċ-ċaqliq għal żmien qasir, kien hemm ukoll tendenza fit-tul ta 'ċerti gruppi demografiċi li jadottaw u jabbandunaw Twitter.

Minbarra l-bidliet f'liema qed juża sistema, hemm ukoll bidliet fis-sistema ta 'kif tintuża s-sistema, li nsejjaħ id-drift fl-imġiba. Pereżempju, matul il-protesti tal-2013 Okkupat Gezi fit-Turkija, id-dimostranti bidlu l-użu tagħhom tal-hashtags hekk kif evolviet il-protesta. Hawnhekk kif Zeynep Tufekci (2014) iddeskriva t-tifrix tal-imġiba, li hija kienet kapaċi tiskopri għaliex kienet qed tosserva mġiba fuq Twitter u personalment:

"Dak li ġara kien li hekk kif il-protesta saret l-istorja dominanti, għadd kbir ta 'nies ... waqqfu jużaw l-hashtags ħlief biex jiġbdu l-attenzjoni għal fenomenu ġdid ... Filwaqt li l-protesti komplew u saħansitra intensifikati, l-hashtags naqsu. L-intervisti wrew żewġ raġunijiet għal dan. L-ewwel, ladarba kulħadd kien jaf it-tema, l-hashtag kien superfluwu u ħela fuq il-pjattaforma tat-Twitter b'karattru limitat. It-tieni nett, l-hashtags dehru biss bħala utli biex jiġbdu l-attenzjoni għal suġġett partikolari, mhux biex wieħed jitkellem dwaru. "

Għalhekk, ir-riċerkaturi li kienu jistudjaw il-protesti billi janalizzaw tweets ma hashtags relatati mal-protesta se jkollhom sens mgħawġa ta 'dak li kien qed jiġri minħabba dan drift imġiba. Per eżempju, dawn jistgħu jemmnu li d-diskussjoni tal-protest naqas twil qabel ma attwalment naqas.

It-tielet tip ta 'drift huwa t-tifrix tas-sistema. F'dan il-każ, mhumiex il-persuni li jinbidlu jew l-imġiba tagħhom tinbidel, iżda s-sistema tinbidel. Pereżempju, maż-żmien Facebook żied il-limitu fuq it-tul tal-aġġornamenti tal-istatus. Għalhekk, kwalunkwe studju lonġitudinali ta 'l-aġġornamenti ta' l-istatus ikun vulnerabbli għall-artifatturi kkawżati minn din il-bidla. Id-devjazzjoni tas-sistema hija relatata mill-qrib ma 'problema msejħa mħawda algoritmiku, li se nkopri fit-taqsima 2.3.8.

Biex nikkonkludu, ħafna sorsi kbar ta 'dejta qed jimxu minħabba bidliet f'liema qed jużawhom, kif qed jintużaw u kif jaħdmu s-sistemi. Dawn is-sorsi ta 'bidla kultant huma mistoqsijiet ta' riċerka interessanti, iżda dawn il-bidliet jikkomplikaw l-abbiltà ta 'sorsi kbar ta' data biex isegwu bidliet fit-tul maż-żmien.