2.3.2.4 Drifting

Drift populace, drift využití a systém drift, aby bylo obtížné používat velký zdroj dat pro studium dlouhodobých trendů.

Jednou z velkých výhod mnoha velkých zdrojů dat je, že shromažďování údajů v průběhu času. Sociální vědci nazývají tento druh nad aktuálními daty, podélných dat. A, samozřejmě, podélné údaje jsou pro studium změn velmi důležité. Aby bylo možné spolehlivě měřit změny však měřicí systém sám o sobě musí být stabilní. Slovy sociologa Otis Dudley Duncan, "Chcete-li měřit změny, neměňte opatření" (Fischer 2011) .

Bohužel, mnoho velké datové systémy-zejména obchodní systém, který vytváří a zachytit digitální stopy-mění po celou dobu, což je proces, který Zavolám drift. Zejména tyto systémy změnit třemi hlavními způsoby: populace drift (změna kdo je jejich použití), chování drift (změna ve způsobu, jakým lidé je používají) a systém drift (změna v samotném systému). Tyto tři zdroje unášení znamená, že jakýkoli vzor digitální data trasování může být způsobeno významnou změnu ve světě, nebo to může být způsobeno nějakou formou postřiků.

Prvním zdrojem drift populaci drift-se, kdo používá systém, a to se změní na dlouholetý váhy a krátkodobé váhy. Například od roku 2008 prezentovat se průměrný věk lidí na sociálních médií se zvýšila. Kromě těchto dlouhodobých trendů, lidé používající systém v každém okamžiku mění. Například v amerických prezidentských volbách roku 2012 byl podíl tweetů o politice, která byla napsána ženy kolísal ze dne na den (Diaz et al. 2016) . To, co se může zdát být změnu v náladě na Twitter-verši ve skutečnosti může být jen změny, která se mluví v každém okamžiku.

Kromě změn ve který používá systém, tam jsou také změny v tom, jak je systém používán. Například během Occupy Gezi Park protesty v Istanbulu v Turecku v roce 2013 demonstrantů změnil jejich použití hashtags jako protest vyvinul. Zde je návod, jak Zeynep Tufekci (2014) popsal drift, který ona byla schopna rozpoznat, protože ona byla pozorování chování na Twitteru a na zemi:

"To, co se stalo, bylo, že jakmile protest se stal dominantní příběh, velké množství lidí. , , přestala používat Hashtagy s výjimkou upozornit na nový fenomén. , .. Zatímco protesty pokračovaly, a dokonce zesílil, že Hashtagy utichl. Rozhovory odhalily dva důvody. Za prvé, jakmile všichni věděli téma se hashtag byl najednou zbytečné a nehospodárné na charakteru omezené Twitter platformu. Za druhé, Hashtagy byly pozorovány pouze jako užitečný pro přilákání pozornosti na konkrétní téma, ne o tom mluvit. "

Proto vědci, kteří studovali protesty analýzou tweety protest v souvislosti s hashtags bude mít zkreslené smysl toho, co se děje, protože toto chování driftu. Například věří, že diskuse o protestu dlouho snížil před tím, než ve skutečnosti snížil.

Třetí druh driftu je systém drift. V tomto případě to nejsou lidé měnící nebo jejich změnu chování, ale samotný systém mění. Například, v průběhu času Facebook zvýšila limit délky aktualizace stavu. Proto by jakákoli dlouhodobá studie o změnách stavu bude náchylné k artefaktů způsobených touto změnou. Systém drift úzce souvisí s problémem s názvem algoritmické matoucí, ke kterému se nyní zaměříme.