2.3.2.4 sodródó

Népesség sodródás, a használat sodródás, és a rendszer sodródás miatt nehéz használni a nagy adatforrás tanulni hosszú távú tendenciákat.

Az egyik nagy előnye a sok nagy adatforrások általuk összegyűjtött adatokat az idő múlásával. A társadalomtudósok hívják ezt a fajta több mint idejű adatok longitudinális adatok. És, természetesen, longitudinális adatok nagyon fontosak a tanuló változás. Annak érdekében, hogy megbízhatóan mérjük változás, azonban a mérés rendszer maga stabilnak kell lennie. A szó a szociológus Otis Dudley Duncan, "ha meg akarja mérni a változás, nem változtatják meg az intézkedést" (Fischer 2011) .

Sajnos, sok nagy adatrendszerek-különösen az üzleti rendszer létrehozása és elfog a digitális nyomok-változnak az idő, ez a folyamat hívlak drift. Különösen ezek a rendszerek átalakítása három fő módja van: a népesség sodródás (változás, aki használja őket), viselkedési sodródás (változás, hogy az emberek használják őket), és a rendszer sodródás (változás maga a rendszer). A három forrása sodródás azt jelenti, hogy minden minta a digitális nyomkövetési adatok okozhatta egy fontos változás a világban, vagy okozhatja valamilyen formában a drift.

Az első forrás drift-populáció eresztőhálókkal van, aki használja a rendszert, és ez nem változik meg a hosszú időskálán és a rövid időskálán. Például 2008-tól, hogy bemutassa a emberek átlagéletkora a szociális média nőtt. Amellett, hogy ezek a hosszú távú tendenciák, az emberek egy olyan rendszer segítségével minden pillanatban változik. Például során az amerikai elnökválasztás 2012 aránya tweets a politika, hogy írtak a nők ingadozott napról napra (Diaz et al. 2016) . Így az, ami talán úgy tűnik, hogy a változás a hangulat a Twitter-vers talán valóban csak olyan változások történnek, aki beszél minden pillanatban.

Amellett, hogy a változások, aki használja a rendszer, ott is változik, hogy a rendszer használata. Például, a Occupy Gezi Park tiltakozások Isztambulban 2013 tüntetők változtattak használata hashtags a tiltakozás alakult ki. Itt van, hogy Zeynep Tufekci (2014) írta le a sodródás, amely képes volt felismerni, mert ő megfigyelése viselkedését a Twitteren és a földön:

"Mi is történt, hogy amint a tiltakozás vált meghatározó történet, sok ember. . . abbahagyta a hashtags kivéve felhívni a figyelmet egy új jelenség. . .. Bár a tüntetések folytatódott, sőt fokozódott, a hashtags lecsillapodott. Az interjúk rávilágítottak két oka van. Először is, ha mindenki tudta, hogy a téma, a hashtag egyszerre volt felesleges és pazarló a karakter korlátozott Twitter platform. Másodszor, hashtags látták csak annyira hasznos a figyelem felkeltése egy adott téma, nem beszél róla. "

Így a kutatók, akik tanulmányozzák a tiltakozások elemzésével tweetjeit tiltakozás kapcsolatos hashtags volna torz értelemben, hogy mi történik, mert ez a viselkedési drift. Például, lehet, hogy úgy vélik, hogy a vita a tiltakozás csökkent jóval azelőtt, hogy ténylegesen csökken.

A harmadik fajta sodródás rendszer drift. Ebben az esetben ez nem az emberek változnak, vagy viselkedésük megváltoztatására, de a rendszer maga is változik. Például idővel Facebook nőtt a határ hossza állapotáról. Így bármilyen longitudinális vizsgálata státusz frissítések lesznek téve a tárgyak által okozott változást. Rendszer sodródás szorosan kapcsolódik a probléma az úgynevezett algoritmikus zavaró, amelyre most viszont.