2.3.2.4 drifting

Populacja dryf, dryft wykorzystanie i dryf systemu sprawiają, że trudno mieć duży źródło danych do badania trendów długoterminowych.

Jedną z wielkich zalet wielu dużych źródeł danych są takie, że zbierają one dane w miarę upływu czasu. Socjologowie nazywają ten rodzaj biegiem czasu danych, danych wzdłużnych. I oczywiście, dane wzdłużne są bardzo ważne dla badania zmian. W celu niezawodnego pomiaru zmiany, jednakże sam układ pomiaru muszą być stabilne. W słowach socjolog Otis Dudley Duncan ", jeśli chcesz zmierzyć zmiany, nie zmieniają środek" (Fischer 2011) .

Niestety, wiele systemów, zwłaszcza na dużej ilości danych, które tworzą system biznesowy i uchwycić ślady-cyfrowe zmienia się cały czas, to proces, który Zadzwonię dryfu. W szczególności, systemy te zmieniają się w trzy główne sposoby: dryf populacji (zmianę, która ich używa), dryft behawioralnej (zmiany w jaki sposób ludzie korzystają z nich), a dryf systemu (zmiany w samym systemie). Te trzy źródła dryfu znaczy, że każdy wzór w śladowych danych cyfrowych może być spowodowany istotnymi zmianami w świecie, czy może to być spowodowane przez jakąś formę dryfu.

Pierwszym źródłem dryftu populacji jest dryf, który korzysta z systemu, a to zmienia się na skale dawna i łuski krótkim czasie. Na przykład od 2008 do przedstawienia średni wiek osób w mediach społecznościowych wzrosła. Oprócz tych długoterminowych trendów, osoby korzystające z systemu w każdej chwili zmienia. Na przykład, w czasie wyborów prezydenckich w USA w 2012 roku odsetek tweets o polityce, które zostały napisane przez kobiety zmieniała się z dnia na dzień (Diaz et al. 2016) . Tak więc, co może wydawać się na zmianę nastroju Twitter-wierszem w rzeczywistości może to być zmiany, który mówi w każdej chwili.

Oprócz zmian, który za pomocą systemu, są również zmiany w sposobie stosuje się układ. Na przykład, podczas protestów Occupy Gezi park w Stambule w 2013 roku protestujący zmienili wykorzystanie hashtagami jako protest ewoluowały. Oto jak Zeynep Tufekci (2014) opisał dryfu, która była w stanie wykryć, ponieważ była obserwując zachowanie na Twitterze i na ziemi:

"Co się stało, że tak szybko, jak protest stał się dominującą historia, wielka liczba ludzi. , , zatrzymany za pomocą hashtags chyba zwrócić uwagę na nowe zjawiska. , .. Podczas gdy protesty kontynuowane, a nawet nasiliły się, gdy hashtags ucichła. Wywiady ujawniła dwa powody tego stanu rzeczy. Po pierwsze, gdy wszyscy wiedzieli temat, hashtag był jednocześnie zbędne i marnotrawstwem na Twitterze platformie charakter ograniczony. Po drugie, hashtags były postrzegane tylko jako przydatna do zwrócenia uwagi na dany temat, a nie o tym mówić. "

W ten sposób naukowcy, którzy badali protesty analizując tweety związane z hashtagami protestu miałoby wypaczony sens tego, co się dzieje z powodu tego zachowania dryfu. Na przykład, mogą sądzić, że dyskusja na temat protestów spadły na długo zanim rzeczywiście spadły.

Trzecim rodzajem jest dryf dryf systemu. W tym przypadku, to nie są ludzie Zmiana lub ich zmianę zachowań, ale sam system zmienia. Na przykład, w miarę upływu czasu Facebook zwiększył limit długości aktualizacji statusu. Zatem każda podłużna studium aktualizacje statusu będzie podatny na artefaktów spowodowanych tą zmianą. Dryf system jest ściśle związane z problemem zwanym algorytmiczne mylących, do której teraz przechodzimy.