2.3.2.4 Drifting

Pedunung mabur, Panggunan mabur, lan sistem mabur wis hard kanggo nggunakake sumber data amba kanggo sinau tren long-term.

Salah kaluwihan gedhe akeh sumber data amba sing padha ngumpulake data liwat wektu. ilmuwan sosial nelpon iki jenis liwat-wektu data, data longitudinal. Lan, alamiah, data longitudinal sing penting banget kanggo sinau pangowahan. Supaya andal ngukur owahan, Nanging, sistem Takeran dhewe kudu stabil. Ing tembung saka sosiolog Otis Dudley Duncan, "yen sampeyan pengin kanggo ngukur owahan, ora ngganti langkah" (Fischer 2011) .

Sayange, akeh sistem-utamané data amba sistem bisnis sing nggawe lan dijupuk digital ngambah-wis ganti kabeh wektu, proses sing aku arep nelpon mabur. Ing tartamtu, sistem iki ngganti jroning telu cara utama: mabur populasi (owah-owahan ing sing digunakake), mabur tindak tanduk (owah-owahan ing cara wong sing digunakake), lan sistem mabur (owah-owahan ing sistem dhewe). Telu sumber mabur ateges sembarang pola data tilak digital bisa disebabake owah-owahan penting ing donya, utawa bisa disebabaké déning sawetara wangun padhet.

Sumber pisanan mabur-populasi mabur-wis sing wis nggunakake sistem, lan iki owah-owahan ing timbangan long-wektu lan timbangan short-wektu. Contone, saka 2008 kanggo saiki umur rata-rata wong ing media sosial wis tambah. Saliyane tren long-term iki, ing wong nggunakake sistem ing sembarang wektu beda-beda gumantung. Contone, sak Pemilu US Presiden 2012 babagan tweets babagan politik sing ditulis dening wanita fluctuated saka dina kanggo dina (Diaz et al. 2016) . Mangkono, apa bisa katon kanggo owah-owahan ing swasana ati saka Twitter-ayat bisa bener mung perubahan ing sing ngomong ing sembarang wektu.

Saliyane owah-owahan ing sing nggunakake sistem, ana uga owah-owahan ing cara sistem digunakake. Contone, sak Occupy Gezi mbantah Park ing Istanbul, Turki ing 2013 demontran diganti nggunakake hashtags minangka protest ing ngalami évolusi. Punika carane Zeynep Tufekci (2014) nggambaraken mabur, kang dheweke bisa ndeteksi amarga dheweke iki ngisi prilaku ing Twitter lan ing lemah:

"Apa wis kedaden ana sing sanalika protest dadi crita unggul, nomer akeh wong. . . mandegake nggunakake hashtags kajaba kanggo tarik manungsa waé menyang kedadean anyar. . .. Nalika mbantah terus, malah panas, ing hashtags seda mudhun. Pitakonan dicethakaké loro alasan kanggo iki. First, sapisan wong sumurup topik, hashtag ana bebarengan superfluous lan boros ing platform Twitter karakter-winates. Kapindho, hashtags padha katon mung minangka migunani kanggo narik perhatian topik tartamtu, ora kanggo ngomong bab iku. "

Mangkono, peneliti sing padha sinau mbantah dening nganalisa tweets karo hashtags-related protest bakal duwe raos kleru apa iki kedados amarga saka mabur tindak tanduk iki. Contone, padha bisa pracaya yen pirembagan protest ing melorot dawa sadurunge iku bener melorot.

Jenis katelu saka mabur iku sistem mabur. Ing kasus iki, iku ora wong ganti utawa owah prilaku, nanging sistem dhewe ganti. Contone, liwat wektu Facebook wis tambah watesan ing dawa nganyari status. Mangkono, sinau longitudinal saka nganyari status bakal ngrugekke kanggo artefak disebabake owah-owahan iki. Sistem mabur iki uga kakait raket kanggo masalah disebut algoritma confounding kanggo kang kita saiki bisa nguripake.