2.3.7 Drifting

Populaasje drift, gebrûk drift, en system drift makket it dreech om grutte data boarnen te brûken om lange termyn te studearjen.

Ien fan 'e grutte foardielen fan in protte grutte data boarnen is dat se gegevens oer de tiid sammelje. Sosjale wittenskippers neame dizze soart oerlêste dat gegevens fan lingtegraad . En, fan 't lêst, binne lingtegraad data tige wichtich foar it ûndersykje feroarjen. Om lykwols te feroarjen fan 'e wiziging, moat it mjingsysteem sels stabyl wêze. Yn 'e wurden fan sosjolooch Otis Dudley Duncan, "as jo wizigje wolle, feroarje de maatregel" (Fischer 2011) .

Spitigernôch binne in soad grutte datasysystemen - benammen bedriuwsysteem - de hiele tiid feroarjen, in proses dat ik drift neamd . Benammen dy systemen feroarje yn trije haadwizen: befolkingsdrift (wiziging yn wa't se brûke), gedrachsgedrach (feroaring yn hoe't se har brûke), en system drift (feroaring yn it systeem sels). De trije boarnen fan drift betsjutte dat elke patroan yn in grutte gegevensboarne feroarsake wurde kin troch in wichtige feroaring yn 'e wrâld, of it kin feroarsake wurde troch guon fan drift.

De earste boarne fan drift-populaasje-drift-wurdt feroarsake troch feroaringen yn wa't it systeem brûke, en dizze feroarings kinne barre op koarte en lange tidencales. Bygelyks by de Amerikaanske presidintsferkiezings fan 2012 is it part fan tweets oer polityk dy't skreaun binne troch froulju swakke fan dei oant dei (Diaz et al. 2016) . Sa kin wat feroaring wêze fan in stimming fan 'e stimming fan' e Twitter-fers, kin gewoanwei in wiziging wêze yn wa't yn elke moment praat. Neist dizze koarte termyn, is der ek in lange termyn trend west fan bepaalde demografyske groepen dy't fêststelle en ferlienen Twitter.

Neist feroaringen yn wa't in systeem brûke, binne der ek wizigingen yn hoe't it systeem brûkt wurdt, dy't ik gedrachsdrukke neamt. Bygelyks, yn 't it besetten fan' e Occupy Gezi yn 't Turkije, hawwe protestanten harren gebrûk fan' e hatten as it protest útwreide. Hjir is beskreaun hoe Zeynep Tufekci (2014) de gedrachsdrift, dy't se yndrukke koe, omdat sy it gedrach fan Twitter en persoan beoardiele:

"Wat der bard wie, wie dat sa gau't it protest it heulende ferhaal waard, stoppe grutte tal minsken ... brûkte de hanthaven, útsein om omtinken te meitsjen foar in nije fenomeen ... Hoewol't de protesten trochgean, en sels ferwiderje, waarden de hântakken ferdwûn. Ynterviews ferskynde twa redenen foar dit. Earst, doe't elkenien it ûnderwerp wist, wie de tenachstik ienris oerflakkich en ferwettere op it karakter-beheind Twitter-platfoarm. Twadder binne aksjebeslaggen allinich sa nuttich te sjoen foar it opnimmen fan oandacht foar in bepaald ûnderwerp, net foar it sprekken oer it. "

Sa, ûndersikers dy't stúdzje de protesten troch analysearjen tweets mei protest-relatearre Hashtags soe hawwe in ambivalinte gefoel fan wat wie bart omdat fan dizze gedrachsproblemen drift. Bygelyks, se soe leauwe dat de diskusje fan it protest ôfnommen lang foardat it eins ôfnommen.

De tredde soarte fan drift is system drift. Yn dit gefal is it net de feroaring fan 'e minsken of har feroaring feroaret, mar it systeem sels feroaret. Bygelyks, oer de tiid Facebook hat de limyt ferhege op 'e lingte fan status updates. Sa kin elke longitudinale stúdzje fan statusynstellingen faaks kwetsber wêze foar artifacts dy't feroarsake binne troch dizze feroaring. Systeemdrift is nau ferbûn mei in probleem dat algoritmyske ferfeling is, dy't ik sjoch yn seksyon 2.3.8.

Om te sluten binne in soad grutte gegevensboarnen driftend troch feroaringen yn wa't har brûke, yn hoe't se brûkt wurde en hoe't de systemen wurkje. Dizze boarne fan wiziging binne soms in nijsgjirrige ûndersyksfragen, mar dizze feroaringen komplikaarje de mooglikheid fan grutte gegevensboarnen om langere feroarings yn 'e tiid te spoaren.