2.3.7 Shkyçja

Domethënie e popullsisë, domethënie e përdorimit dhe devijimi i sistemit e bëjnë të vështirë përdorimin e burimeve të mëdha të të dhënave për të studiuar tendencat afatgjata.

Një nga avantazhet e mëdha të shumë burimeve të mëdha të të dhënave është se ata mbledhin të dhëna me kalimin e kohës. Shkencëtarët socialë e quajnë këtë lloj të dhënash gjatë të dhënave gjatësore . Dhe, natyrisht, të dhënat gjatësore janë shumë të rëndësishme për të studiuar ndryshimet. Për të matur ndryshimin e besueshëm, megjithatë sistemi i matjes duhet të jetë i qëndrueshëm. Sipas fjalëve të sociologut Otis Dudley Duncan, "nëse doni ta matni ndryshimin, mos e ndryshoni masën" (Fischer 2011) .

Për fat të keq, shumë sisteme të mëdha të të dhënave, sidomos sistemet e biznesit, po ndryshojnë gjatë gjithë kohës, një proces që unë do të thërras drift . Në veçanti, këto sisteme ndryshojnë në tri mënyra kryesore: domethënie e popullsisë (ndryshimi i përdoruesve ), sjellja e sjelljes (ndryshimi në mënyrën se si njerëzit i përdorin ato) dhe devijimi i sistemit (ndryshimi i vetë sistemit). Tre burimet e domethënies nënkuptojnë se çdo model në një burim të madh të të dhënave mund të shkaktohet nga një ndryshim i rëndësishëm në botë, ose mund të shkaktohet nga ndonjë formë e domethënies.

Burimi i parë i domethënies së drift-popullsisë është shkaktuar nga ndryshimet në kush përdor sistemin, dhe këto ndryshime mund të ndodhin në të dy afatet kohore të shkurtra dhe të gjata. Për shembull, gjatë zgjedhjeve presidenciale amerikane të vitit 2012, përqindja e tweeve rreth politikës që janë shkruar nga gratë luhatën nga dita në ditë (Diaz et al. 2016) . Kështu, ajo që mund të duket të jetë një ndryshim në disponimin e vargut të Twitter-it mund të jetë vetëm një ndryshim në atë se kush po flet në çdo moment. Përveç këtyre luhatjeve afatshkurtra, ka patur një trend afatgjatë të disa grupeve demografike që miratojnë dhe braktisin Twitter.

Përveç ndryshimeve në kush përdor një sistem, ka edhe ndryshime në mënyrën se si përdoret sistemi, të cilin e quaj domethënie sjelljeje. Për shembull, gjatë protestave në Geri të vitit 2013, protestuesit ndryshuan përdorimin e hashtags kur protesta u zhvillua. Ja se si Zeynep Tufekci (2014) përshkroi sjelljen e sjelljes, të cilën ajo ishte në gjendje të zbulonte, sepse ajo po vëzhgonte sjelljet në Twitter dhe personalisht:

"Ajo që kishte ndodhur ishte se sapo protesta të bëhej tregimi dominues, një numër i madh njerëzish ... ndaluan përdorimin e hashtags me përjashtim të tërheqjes së vëmendjes ndaj një fenomeni të ri ... Ndërsa protesta vazhdoi dhe madje intensifikohej, hashtagët u vranë. Intervistat zbuluan dy arsye për këtë. Së pari, pasi të gjithë e dinin temën, hashtag ishte menjëherë i tepërt dhe i kota në platformën e kufizuar të karakterit Twitter. Së dyti, hashtags janë parë vetëm si të dobishme për të tërhequr vëmendjen për një temë të veçantë, jo për të folur për të. "

Kështu, studiuesit të cilët janë duke studiuar protestat duke analizuar tweets me hashtags protestës të lidhura do të ketë një kuptim të shtrembëruar të asaj që po ndodhte për shkak të kësaj domethënie të sjelljes. Për shembull, ata mund të besojnë se diskutimi i protestës ka rënë shumë kohë para se ai në fakt është ulur.

Lloji i tretë i domethënies është driftimi i sistemit. Në këtë rast, njerëzit nuk ndryshojnë ose sjellja e tyre ndryshon, por vetë sistemi ndryshon. Për shembull, me kalimin e kohës, Facebook-u ka rritur kufirin për gjatësinë e përditësimeve të statusit. Kështu, çdo studim gjatësor i përditësimeve të statusit do të jetë i prekshëm ndaj artefakteve të shkaktuara nga ky ndryshim. Drift sistemi është i lidhur ngushtë me një problem të quajtur konfuzion algoritmike, të cilën unë do të mbulojë në seksionin 2.3.8.

Përfundim, shumë burime të mëdha të dhënash po shkon për shkak të ndryshimeve në kush i përdor ato, në mënyrën se si po përdoren dhe në mënyrën se si funksionojnë sistemet. Këto burime ndryshimi janë ndonjëherë pyetje interesante për hulumtime, por këto ndryshime komplikojnë mundësinë e burimeve të mëdha të të dhënave për të gjetur ndryshimet afatgjata me kalimin e kohës.