2.3.2.4 Drifting

Populasyon drift, paggamit drift, at sistema ng drift gawin itong mahirap na gumamit ng malaking source ng data sa pag-aaral ng pang-matagalang mga uso.

Ang isa sa mga mahusay na bentahe ng maraming mga malaki mga pinagkukunan ng data ay na sila mangolekta ng data sa paglipas ng panahon. Social siyentipiko tumawag ito uri ng over-time na data, paayon data. At, natural, pahabang datos ay napakahalaga para sa pag-aaral ng pagbabago. Upang mapagkakatiwalaan masukat pagbabago, gayunpaman, ang pagsukat sistema mismo ay dapat na matatag. Sa mga salita ng sosyolohista Otis Dudley Duncan, "kung gusto mo upang masukat pagbabago, huwag baguhin ang mga panukalang-batas" (Fischer 2011) .

Sa kasamaang palad, maraming mga malaki data systems-lalo na negosyo sistema na lumikha at makuha digital traces-ay nagbabago sa lahat ng oras, isang proseso na Tatawag ako drift. Sa partikular, ang mga sistema baguhin sa tatlong pangunahing paraan: populasyon drift (pagbabago sa kung sino ang gumagamit ng mga ito), asal drift (pagbabago sa kung paano ang mga tao ay gumagamit ng mga ito), at sistema ng drift (pagbabago sa sistema ng kanyang sarili). Ang tatlong mga pinagkukunan ng drift nangangahulugan na ang anumang pattern sa digital data trace ay maaaring sanhi ng isang mahalagang pagbabago sa mundo, o maaari itong maging sanhi ng ilang mga paraan ng drift.

Ang unang pinagmulan ng naaanod na-populasyon drift-ay kung sino ang gumagamit ng sistema, at ito mga pagbabago sa pang-oras kaliskis at maikling-time kaliskis. Halimbawa, mula 2008 hanggang kasalukuyan ang average na edad ng mga tao sa mga social media ay nadagdagan. Bilang karagdagan sa mga pang-matagalang trend, ang mga taong gumagamit ng isang sistema sa anumang sandali ay nag-iiba. Halimbawa, sa panahon ng US Presidential halalan ng 2012 ang proporsyon ng mga tweet tungkol sa pulitika na isinulat ng mga kababaihan fluctuated sa araw-araw (Diaz et al. 2016) . Kaya, kung ano ang maaaring lumitaw na maging isang pagbabago sa ang mood ng Twitter-verse ay maaaring aktwal na maging lamang ang mga pagbabago sa kung sino ang pakikipag-usap sa anumang sandali.

Bilang karagdagan sa mga pagbabago sa kung sino ang gumagamit ng isang sistema, mayroon ding mga pagbabago sa kung paano ang sistema ay ginagamit. Halimbawa, sa panahon ng Occupy Gezi Park protesta sa Istanbul, Turkey sa 2013 protesters pinapagbago ang kanilang paggamit ng mga hashtags bilang ang protest umunlad. Narito kung paano Zeynep Tufekci (2014) inilarawan ang naaanod na, na kung saan siya ay able sa tiktikan dahil siya ay observing uugali sa Twitter at sa lupa:

"Ano ang nangyari ay na sa lalong madaling ang protesta ay naging ang nangingibabaw na kuwento, ang malaking bilang ng mga tao. . . tumigil sa paggamit ng hashtags maliban upang gumuhit ng pansin sa isang bagong hindi pangkaraniwang bagay. . .. Habang ang mga protesta patuloy na, at kahit intensified, ang hashtags namatay pababa. Panayam nagsiwalat dalawang kadahilanan para dito. Una, sa sandaling lahat alam ang paksa, ang hashtag ay sabay-sabay kalabisan at mapag-aksaya sa karakter-limitado Twitter platform. Pangalawa, hashtags ay makikita lamang bilang kapaki-pakinabang para sa akit ng pansin sa isang partikular na paksa, hindi para sa pakikipag-usap tungkol dito. "

Kaya, ang mga mananaliksik na nag-aaral ang mga protesta sa pamamagitan ng pagsusuri tweet na may pasubali na may kinalaman sa hashtags ay magkaroon ng isang pangit na kahulugan ng kung ano ang nangyayari dahil sa ito pang-asal drift. Halimbawa, maaaring sila ay naniniwala na ang talakayan ng mga protesta nabawasan katagal bago ito aktwal na nabawasan.

Ang ikatlong uri ng drift ay ang sistema drift. Sa kasong ito, ito ay hindi ang mga tao pagbabago o kanilang pag-uugali pagbabago, ngunit ang sistema mismo nagbabago. Halimbawa, sa paglipas ng panahon Facebook ay nadagdagan ang limitasyon sa haba ng mga update ng katayuan. Kaya, ang anumang paayon pag-aaral ng mga update ng katayuan ay magiging mahina laban sa artifacts sanhi ng pagbabagong ito. System drift ay malapit na nauugnay sa problemang tinatawag algorithmic confounding na kung saan tayo tutungo.