2.3.7 Drifting

Populasi, drift panggunaan, lan sistem mabur ngalang-alangake nggunakake sumber data gedhe kanggo sinau babagan tren jangka panjang.

Salah siji saka kaluwihan gedhe saka sumber data gedhe yaiku ngumpetake data sakwektu. Ilmuwan sosial nyebut data data longitudinal liwat wektu iki. Lan, sacara alami, data longitudinal penting banget kanggo sinau owah-owahan. Nanging kanggo ngukur owah-owahan, Nanging, sistem pangukuran dhewe kudu stabil. Ing tembung sosiolog Otis Dudley Duncan, "yen sampeyan pengin ngukur owahan, ora ngowahi langkah" (Fischer 2011) .

Sayange, akeh sistem data amba-utamane sistem bisnis-wis ganti kabeh wektu, proses aku bakal nelpon drift . Utamane, sistem kasebut ngganti kanthi telung cara utama: drift populasi (owah-owahan sing digunakake), drift perilaku (perubahan cara wong nggunakake), lan sistem drift (ganti sistem kasebut). Telu sumber drift tegese yen pola apa wae ing sumber data gedhe bisa disebabake owah-owahan penting ing donya, utawa bisa uga disebabake sawetara wangun drift.

Sumber pisanan saka drift-drift-disababaké déning owah-owahan ing sing nggunakake sistem, lan owah-owahan bisa kedadeyan ing loro-lorone cendhak lan dawa. Contone, ing pemilihan presiden AS 2012, proporsi tweets babagan politik sing ditulis dening wanita fluktuasi saka dina kanggo dina (Diaz et al. 2016) . Mangkono, apa sing katon minangka owah-owahan ing swasana ati Twitter-ayat bisa uga mung dadi owah-owahan ing sing ngomong kapan wae. Saliyane fluktuasi jangka pendek iki, ana uga tren jangka panjang kelompok demografi tartamtu sing nggunaake lan nglirwaaken Twitter.

Saliyane owah-owahan ing sing nggunakake sistem, ana uga owah-owahan ing cara sistem digunakake, kang aku nelpon drift prilaku. Contone, nalika 2013 ngupayakake protes Gezi ing Turki, para demonstran ngganti nggunakake hashtags nalika protes mau berkembang. Punika babagan Zeynep Tufekci (2014) nyebataken drift perilaku, ingkang saged dipunmangertosi amargi piyambakipun nindakaken perilaku ing Twitter lan secara pribadi:

"Apa sing kedadean iku nalika protest dadi crita sing dominan, akeh wong ... mandheg nganggo hashtags kajaba kanggo ngenthengake fenomena anyar ... Nalika protes terus, malah ngalami intensif, hashtags tilar donya. Wawancara ngungkapake rong alasan babagan iki. Kaping pisanan, nalika saben wong ngerti topik kasebut, hashtag sakdurunge wis akeh lan boroske ing platform Twitter. Kapindho, hashtags katon mung minangka migunani kanggo narik kawigaten menyang topik tartamtu, ora kanggo ngomong babagan iki. "

Mangkono, peneliti sing padha sinau mbantah dening nganalisa tweets karo hashtags-related protest bakal duwe raos kleru apa iki kedados amarga saka mabur tindak tanduk iki. Contone, padha bisa pracaya yen pirembagan protest ing melorot dawa sadurunge iku bener melorot.

Jenis drift katelu yaiku sistem drift. Ing kasus iki, ora wong ganti utawa perilaku sing ganti, nanging sistem dhewe ganti. Contone, liwat wektu Facebook nambah watesan ing dawa nganyari status. Mangkono, apa wae panuntun dhasar nganyari status longitudinal bakal ngrugekke kanggo artefak sing disebabake owah-owahan kasebut. Sistem drift erat hubungane karo masalah sing diarani algorithmic confounding, sing bakal dakkandhakake ing bagean 2.3.8.

Kanggo nyimpulake, akeh sumber data amba amarga owah-owahan ing sing nggunakake, carane digunakake, lan cara sistem bisa digunakake. Sumber-sumber owah-owahan iki kadhangkala pitakonan riset menarik, nanging owah-owahan iki mbebayani kemampuan sumber data gedhe kanggo ngatasi owah-owahan jangka panjang saka wektu.