2.3.2.4 vijavica

Stanovništvo drift, korištenje drift, a sustav nanos čine ga teško koristiti veliki izvor podataka za proučavanje dugoročne trendove.

Jedna od velikih prednosti mnogih velikih izvora podataka koji su prikupljanje podataka tijekom vremena. Socijalni znanstvenici nazivaju ovu vrstu vremenskog podataka, uzdužnih podataka. I, naravno, uzdužni podaci su vrlo važni za proučavanje promjena. Kako bi se pouzdano mjerenje promjena, međutim, sustav za mjerenje sama moraju biti stabilni. Prema riječima sociologa Otis Dudley Duncan, "ako želite izmjeriti promjenu, ne mijenjaju mjeru" (Fischer 2011) .

Nažalost, mnogi veliki podatkovni sustavi, osobito poslovni sustav koji stvara i hvatanje digitalnih Traces se mijenjaju cijelo vrijeme, što je proces koji ću nazvati zanošenje. Konkretno, ovi sustavi promijeniti u tri glavna načina: stanovništvo drifta (promjena koja se pomoću njih), ponašanju drift (promjena u načinu na koji ljudi koriste ih), te sustav drift (promjena samog sustava). Tri izvora drift znači da bilo koji uzorak u podacima digitalnim tragovima može biti uzrokovan važnih promjena u svijetu, ili to može biti uzrokovano nekom obliku nanosa.

Prvi izvor drift-stanovništva drift-je koji se koristi sustav, a to mijenja na dugogodišnji vage i kratkih vremenskih razdoblja. Na primjer, od 2008. do danas je prosječna dob ljudi na društvenim medijima je u porastu. Osim ovih dugoročnih trendova, ljudi koji koriste sustav u svakom trenutku varira. Na primjer, za vrijeme izbora predsjednika SAD 2012. godine udio tweets o politici koje su napisali žena kretao se iz dana u dan (Diaz et al. 2016) . Dakle, ono što se može činiti promjene u raspoloženju Twitter-stih zapravo može biti samo promjena koja se govori u bilo kojem trenutku.

Osim promjena u koji koristi sustav, tu su i promjene u načinu na koji se koristi sustav. Na primjer, tijekom Occupy Gezi Park prosvjede u Istanbulu, Turska, 2013 prosvjednika promijenila njihove uporabe izrazi s oznakom # kao protest razvijao. Evo kako Zeynep Tufekci (2014) opisao nanos, koja je bila u stanju otkriti jer je promatranje ponašanja na Twitteru i na zemlji:

"Ono što se dogodilo je da čim prosvjeda postala dominantna priča, veliki broj ljudi. , , zaustavljen pomoću #oznake osim skrenuti pozornost na novi fenomen. , .. Dok su prosvjedi nastaviti, pa čak i pojačane, a izrazi s oznakom # stišao. Intervjui otkrila dva razloga za to. Prvo, nakon što su svi znali za temu, hashtag je odjednom suvišno i rasipan na karakter ograničen Twitter platforme. Drugo, izrazi s oznakom # viđeni samo kao korisna za privlačenje pozornosti na određenu temu, a ne za razgovor o tome. "

Dakle, istraživači koji su proučavali proteste analizom tweetove s prosvjednih vezane izrazi s oznakom # će imati iskrivljenu osjećaj za ono što se događa zbog toga ponašanja nanosa. Na primjer, oni vjeruju da je rasprava o prosvjedu smanjena dugo prije nego što je zapravo smanjena.

Treća vrsta nanosa je sustav drift. U ovom slučaju, to nisu ljudi mijenjaju ili njihovo ponašanje mijenja, ali sam sustav mijenja. Na primjer, tijekom vremena Facebook je povećao ograničenje na duljinu ažuriranja statusa. Dakle, bilo longitudinalno istraživanje o promjenama statusa će biti osjetljiva na artefakata uzrokovanih ovim promjenama. drift sustava usko je povezana s problemom zove algoritamski zbunjivanje na koje smo sada okrenuti.