2.3.2.4 Drifting

Populasi drift, pamakéan drift, sarta sistim drift make hard ngagunakeun sumber data gedé pikeun diajar tren jangka panjang.

Salah sahiji kaunggulan gede loba sumber data gedé aya nu boga maranehna ngumpulkeun data dumasar kana waktu. élmuwan Sosial nelepon nanaon ieu leuwih-time data, data longitudinal. Jeung, alami, data longitudinal kacida penting pikeun nalungtik parobahan. Dina raraga reliably ngukur parobahan kitu, sistem ukuran sorangan kudu stabil. Dina kecap sosiolog Otis Dudley Duncan, "upami Anjeun hoyong ngukur parobahan, teu ngarobah ukur" (Fischer 2011) .

Hanjakalna, loba sistem-utamana data gedé sistim bisnis nu nyieun jeung poto digital ngambah-nu ngarobah sadaya waktu, hiji prosés nu Abdi gé nelepon drift. Dina sababaraha hal, sistem ieu ngarobah tilu cara utama: drift populasi (parobahan dina anu ngagunakeun eta), drift behavioral (parobahan dina kumaha jalma nu ngagunakeun eta), jeung sistim drift (change dina sistim sorangan). Tilu sumber drift mean nu mana wae pola di data renik digital bisa disababkeun ku hiji parobahan penting di dunya, atawa bisa disababkeun ku sababaraha bentuk drift.

Sumber munggaran drift-populasi drift-ieu anu ngagunakeun sistem, ieu robah dina skala lila-waktu jeung skala pondok-waktu. Contona, ti 2008 nampilkeun umur rata-rata jalma dina média sosial geus ngaronjat. Salian tren jangka panjang ieu, urang ngagunakeun sistem di moment nu mana wae nu beda-beda. Contona, mangsa Pemilu US Présidén 2012 proporsi tweets ngeunaan pulitik nya éta ditulis ku awewe fluctuated ti poé ka poé (Diaz et al. 2016) . Ku kituna, naon bisa mucunghul jadi parobahan dina wanda tina Twitter-ayat bisa sabenerna euy jadi parobahan anu ngawangkong di moment nu mana waé.

Salian parobahan anu ngagunakeun sistem, aya oge robah di kumaha sistim ieu dipaké. Contona, mangsa ngeusian protes Gezi Park di Istanbul, Turki di 2013 démonstran robah dipake maranéhanana hashtags salaku protes nu ngalobaan. Di dieu nu kumaha Zeynep Tufekci (2014) digambarkeun drift, nu manéhna bisa ngadeteksi sabab manéhna observasi paripolah dina Twitter jeung dina taneuh:

"Naon anu lumangsung ieu nu pas protes nu jadi carita dominan, nomer gede urang. . . dieureunkeun ngagunakeun hashtags iwal ngagambar perhatian ka fenomena anyar. . .. Sedengkeun protes terus, komo inténsif, nu hashtags maot handap. Wawancara wangsit dua alesan pikeun ieu. Kahiji, sakali dulur terang topik, hashtag ieu sakaligus superfluous jeung boros dina platform Twitter karakter-diwatesan. Kadua, hashtags anu katempo ngan minangka dipake keur attracting perhatian ka topik nu tangtu, teu ngawangkong ngeunaan eta. "

Ku kituna, panalungtik anu ngulik protes ku analisa tweets jeung hashtags patali protes bakal boga rasa menyimpang naon ieu lumangsung alatan drift behavioral ieu. Contona, maranéhanana bisa percaya yén sawala protes nu turun lila saméméh sabenerna turun.

Jenis katilu drift nyaeta sistim drift. Dina hal ieu, teu jalma ngarobah atawa ngarobah paripolah maranéhanana, tapi sistem sorangan ngarobah. Contona, dumasar kana waktu Facebook geus ngaronjat limit dina panjang apdet status. Ku kituna, nu mana wae ulikan longitudinal of apdet status bakal rentan ka artefak disababkeun ku parobahan ieu. System drift téh raket patalina jeung masalah disebut algorithmic confounding nu urang ayeuna giliran.