2.3.7 Drifting

Bevolkingsdrywing, gebruiksdrywing en stelseldrywing maak dit moeilik om groot databronne te gebruik om langtermyn tendense te bestudeer.

Een van die groot voordele van baie groot databronne is dat hulle data oor tyd versamel. Sosiale wetenskaplikes noem hierdie soort oorgangsdata- longitudinale data . En natuurlik is longitudinale data baie belangrik vir die studie van verandering. Om die verandering betroubaar te meet, moet die meetstelsel self stabiel wees. In die woorde van sosioloog Otis Dudley Duncan, "as jy verandering wil meet, verander nie die maatreël nie" (Fischer 2011) .

Ongelukkig verander baie groot datastelsels, veral besigheidstelsels, die hele tyd, 'n proses wat ek wegdryf . In die besonder verander hierdie stelsels op drie hoof maniere: bevolkingsdrywing (verandering in wie dit gebruik), gedragsdrift (verandering in hoe mense dit gebruik) en stelseldrywing (verandering in die stelsel self). Die drie dryfbronne beteken dat enige patroon in 'n groot databron deur 'n belangrike verandering in die wêreld veroorsaak kan word, of dit kan veroorsaak word deur een of ander vorm van wegdrywing.

Die eerste bron van drifbevolking-word veroorsaak deur veranderinge in wie die stelsel gebruik, en hierdie veranderinge kan op beide kort en lang tye plaasvind. Byvoorbeeld, tydens die Amerikaanse presidensiële verkiesing van 2012 het die verhouding van tweets oor politiek wat deur vroue geskryf is, van dag tot dag gewissel (Diaz et al. 2016) . So, wat lyk asof dit 'n verandering in die stemming van die Twitter-vers is, kan eintlik net 'n verandering wees in wie op enige oomblik praat. Benewens hierdie korttermynskommelings, was daar ook 'n langtermyn-tendens van sekere demografiese groepe wat Twitter aanneem en verlaat.

Benewens veranderinge in wie 'n stelsel gebruik, is daar ook veranderinge in hoe die stelsel gebruik word, wat ek gedraggedrywing noem. Byvoorbeeld, tydens die 2013-besetting Gezi-protes in Turkye het betogers hul gebruik van hashtags verander namate die protes ontwikkel het. Hier is hoe Zeynep Tufekci (2014) die gedragsdrywing beskryf, wat sy kon opspoor omdat sy gedrag op Twitter waarneem en persoonlik:

"Wat gebeur het was dat sodra die protes die dominante verhaal geword het, het groot getalle mense opgehou met die gebruik van die hashtags, behalwe om die aandag te vestig op 'n nuwe verskynsel. Terwyl die protes voortgesit het en selfs versterk het, het die hashtags gesterf. Onderhoude het twee redes hiervoor geopenbaar. Eerstens, nadat almal die onderwerp geweet het, was die hashtag onmiddelik oorbodig en verkwistend op die karakter-beperkte Twitter-platform. Tweedens, hashtags is net gesien as nuttig om aandag te vestig op 'n spesifieke onderwerp, nie om daaroor te praat nie. "

So, navorsers wat die protes was studeer deur die ontleding van tweets met protes-verwante hashtags sou 'n verwronge sin van wat daar gebeur het as gevolg van hierdie gedragspatrone drif het. Byvoorbeeld, kan hulle glo dat die bespreking van die protes afgeneem lank voordat dit eintlik afgeneem.

Die derde soort drif is stelseldrywing. In hierdie geval is dit nie die mense wat verander of hul gedrag verander nie, maar die stelsel self verander. Byvoorbeeld, met verloop van tyd het Facebook die beperking op die lengte van statusopdaterings verhoog. Dus, enige longitudinale studie van statusopdaterings sal kwesbaar wees vir artefakte wat deur hierdie verandering veroorsaak word. Stelsel drywing is nou verwant aan 'n probleem genaamd algoritmiese verwarring, wat ek in afdeling 2.3.8 sal dek.

Ter afsluiting dryf baie groot databronne as gevolg van veranderinge in wie dit gebruik, hoe dit gebruik word en hoe die stelsels werk. Hierdie bronne van verandering is soms interessante navorsingsvrae, maar hierdie veranderinge bemoeilik die vermoë van groot databronne om langtermynveranderings op te spoor.