2.3.7 Drifting

Väestön kulku, kulutus ja järjestelmän kulkeutuminen vaikeuttavat suurien tietolähteiden käyttöä pitkäaikaisten suuntausten tutkimiseen.

Yksi suurista tietolähteistä on se, että ne keräävät tietoja ajan mittaan. Yhteiskuntatieteilijät kutsuvat tällaisia ​​ylituotantoja pitkittäisiksi tiedoiksi . Luonnollisesti pituussuuntaiset tiedot ovat hyvin tärkeitä muutoksen tutkimiselle. Jotta muutos voidaan mitata luotettavasti, mittausjärjestelmän on kuitenkin oltava stabiili. Sosiologin Otis Dudley Duncanin sanojen mukaan "jos haluat mitata muutoksia, älä muuta toimenpiteitä" (Fischer 2011) .

Valitettavasti monet suuret tietojärjestelmät - erityisesti yritysjärjestelyt - muuttuvat koko ajan, prosessi, jota kutsun ajelehtimiseksi . Erityisesti nämä järjestelmät muuttuvat kolmella tavalla: väestön kulkeutuminen (muutos keneen käyttää niitä), käyttäytymisen ajaminen (muutos siitä, miten ihmiset käyttävät niitä) ja järjestelmän kulkeutuminen (muutos itse järjestelmässä). Kolmen lähteen lähde tarkoittaa sitä, että suuren tietolähteen kuvio voi johtua tärkeästä muutoksesta maailmassa tai se voi johtua jonkinlaisesta ajautumisesta.

Ajettavan väestön ajoradan ensimmäinen lähde johtuu siitä, ketkä käyttävät järjestelmää muutoksia, ja nämä muutokset voivat tapahtua sekä lyhyillä että pitkällä aikavälillä. Esimerkiksi Yhdysvaltain vuoden 2012 presidentinvaalien aikana naisten kirjoittamien tweetyjen osuus politiikasta vaihteli päivittäin (Diaz et al. 2016) . Niinpä se, mikä saattaa tuntua olevan muutos Twitter-jakeessa, saattaa todellakin olla vain muutos kuka tahansa puhuu milloin tahansa. Näiden lyhytaikaisten vaihteluiden ohella tiettyjen väestöryh- mien ryhmiin on suhtauduttu pitkällä aikavälillä, kun he hyväksyvät Twitterin ja hylkäävät sen.

Järjestelmän käyttäjiä koskevien muutosten lisäksi järjestelmässä käytetään myös muutoksia, joita kutsun käyttäytymisen ajaksi. Esimerkiksi vuoden 2013 miehitetyissä Gezi-mielenosoituksissa Turkissa mielenosoittajat muuttivat hashtagien käyttöä protektion kehittymisen myötä. Tässä kerrotaan, miten Zeynep Tufekci (2014) kuvasi käyttäytymistapoja, jonka hän pystyi havaitsemaan, koska hän tarkkaili käyttäytymistä Twitterissä ja henkilökohtaisesti:

"Sellaista, mitä tapahtui, oli, että heti kun protestista tuli hallitseva tarina, suuri joukko ihmisiä lopetti hashtagien käyttämisen paitsi kiinnittää huomiota uuteen ilmiöön ... Vaikka protestit jatkuivat ja jopa tehostuivat, hashtagit kuolivat. Haastatteluista ilmeni kaksi syytä tähän. Ensinnäkin, kun kaikki tietävät aiheen, hashtag oli välittömästi tarpeeton ja tuhlaava merkkijonoon Twitter-alustalle. Toiseksi, hashtags katsottiin vain hyödylliseksi kiinnittääkseen huomiota tiettyyn aiheeseen, ei puhumattakaan siitä. "

Niinpä tutkijat jotka opiskelivat mielenosoituksista analysoimalla tweets kanssa protesti liittyviä hashtags olisi vääristynyt tunne, mitä oli tapahtumassa, koska tämän käyttäytymisen drift. Esimerkiksi ne uskoisivat, että keskustelu protesti laski kauan ennen kuin se todella vähentynyt.

Kolmas tyyppinen ajautuminen on järjestelmän ajelehtiminen. Tässä tapauksessa ihmiset eivät muutu tai käyttäytyminen muuttuu, mutta järjestelmä itse muuttuu. Ajan myötä Facebook on lisännyt tilapäivitysten pituuden rajaa. Näin ollen mikä tahansa pitkittäinen tilastopäivitystutkimus on herkkä tämän muutoksen aiheuttamille esineille. Järjestelmän ajovirta liittyy läheisesti algoritmiseen häiriöön kutsuttuun ongelmaan, jota käsitellään kohdassa 2.3.8.

Lopuksi monet suuret tietolähteet ajelehtivat, koska he käyttävät muutoksia, miten niitä käytetään ja miten järjestelmät toimivat. Nämä muutoksen lähteet ovat joskus mielenkiintoisia tutkimuskysymyksiä, mutta nämä muutokset vaikeuttavat suurien tietolähteiden kykyä seurata pitkäaikaisia ​​muutoksia ajan myötä.