2.3.7 Դրեյֆինգ

Բնակչության քաշքշումը, օգտագործման քաշքշումը եւ համակարգային հեռացումը դժվարացնում են երկարատեւ միտումները ուսումնասիրելու համար մեծ տվյալների աղբյուրներ օգտագործելը:

Շատ մեծ տվյալների աղբյուրների մեծ առավելություններից մեկն այն է, որ նրանք ժամանակի ընթացքում հավաքում են տվյալներ: Հասարակական գիտնականները կոչում են նման ժամանակակից տվյալների երկարատեւ տվյալներ : Եվ, բնականաբար, երկարատեւ տվյալները շատ կարեւոր են փոփոխության ուսումնասիրման համար: Փոփոխությունը հավաստի չափելու համար, սակայն, չափման համակարգը պետք է կայուն լինի: Սոցիոլոգ Օթիս Դադլի Դունջանի խոսքերով, «եթե ուզում եք չափել փոփոխությունը, մի միջոցը չփոխեք» (Fischer 2011) :

Ցավոք, շատ մեծ տվյալների համակարգեր, հատկապես բիզնես համակարգեր, փոխվում են բոլոր ժամանակները, մի գործընթաց, որը ես կխնդրեմ կախել : Մասնավորապես, այս համակարգերը փոխվում են երեք հիմնական եղանակով ` բնակչությունը քշում (փոխում է նրանց, ովքեր օգտագործում են դրանք), վարքագծային քայքայումը (փոփոխությունը, թե ինչպես են մարդիկ օգտագործում դրանք) եւ համակարգը քաշում ( համակարգում փոփոխություն): Դրեյֆի երեք աղբյուրները նշանակում են, որ մեծ տվյալների աղբյուրի ցանկացած օրինակ կարող է հանգեցնել աշխարհում կարեւոր փոփոխության, կամ դա կարող է առաջանալ որոշակի կախվածության պատճառով:

Դրմբի բնակչության կախվածության առաջին աղբյուրը պայմանավորված է այն համակարգի փոփոխությամբ, որն օգտագործվում է համակարգում, եւ այդ փոփոխությունները կարող են տեղի ունենալ ինչպես կարճ, այնպես էլ երկար ժամանակահատվածներում: Օրինակ, ԱՄՆ-ի նախագահական ընտրությունների ժամանակ 2012-ի ընթացքում կանանց կողմից գրված քաղաքականության մասին գրառումների տեսակարար կշիռը տատանվում էր օրեցօր (Diaz et al. 2016) : Այսպիսով, ինչ կարող է թվալ, որ Twitter- ի ոգով տրամադրված փոփոխությունը կարող է իրական փոփոխություն լինել, թե ով է ցանկացած պահի խոսում: Բացի այդ կարճաժամկետ տատանումներից, եղել է նաեւ երկարաժամկետ միտում, որոշակի ժողովրդագրական խմբեր, որոնք ընդունում եւ հեռացնում են Twitter- ը:

Բացի փոփոխություններից, որոնք օգտագործում են համակարգը, կան նաեւ փոփոխություններ, թե ինչպես է օգտագործվում համակարգը, որը ես կոչում եմ վարքագծային շեղում: Օրինակ, 2013 թ. Թուրքիայում Զինված Գեզիի բողոքի ցույցերի ժամանակ ցուցարարները փոխեցին իրենց հեշթագների օգտագործումը, քանի որ բողոքի զարգացումը դարձավ: Ահա թե ինչպես Zeynep Tufekci (2014) նկարագրեց վարքագիծը, որը նա կարողացավ հայտնաբերել, քանի որ նա հետեւում էր Twitter- ի վարքին եւ անձամբ.

«Այն, ինչ տեղի է ունեցել, հենց այն բանից հետո, երբ բողոքի ակցիան դարձավ գերիշխող պատմություն, մեծ թվով մարդիկ ... դադարեցրին հեշթագների օգտագործումը, բացառությամբ ուշադրությունը հրավիրելու նոր երեւույթի ... Մինչ բողոքի շարունակությունը, եւ նույնիսկ ուժեղացան, հեշթագները մահացան: Հարցազրույցների արդյունքում պարզ դարձավ երկու պատճառ: Նախ, բոլորը գիտեին թեման, հեշթեգը միանգամից ավելորդ էր եւ վատ: Երկրորդը, հեշթագները տեսանելի էին միայն օգտակար, որոշակի թեման ներգրավելու համար, այլ ոչ թե դրա մասին խոսելու համար »:

Այսպիսով, հետազոտողները, ովքեր ուսումնասիրում են բողոքի ցույցերը `վերլուծելով Թվիթեր բողոքի հետ կապված hashtags կունենար խեղաթյուրված զգացում, թե ինչ էր կատարվում, քանի որ այս վարքագծային քշել. Օրինակ, նրանք կարող հավատալ, որ այդ քննարկումը բողոքի նվազել երկար, մինչեւ որ, ըստ էության, նվազել է:

Երրորդ տարբերակը քաշում է համակարգային քաշքշուկը: Այս պարագայում դա փոխվում է կամ փոխվում է նրանց վարքագիծը, բայց համակարգը փոխվում է: Օրինակ, ժամանակի ընթացքում Facebook- ը բարձրացրել է կարգավիճակի թարմացման երկարության սահմանը: Այսպիսով, կարգավիճակի թարմացումների ցանկացած երկարատեւ ուսումնասիրությունը խոցելի կլինի այս փոփոխության արդյունքում առաջացող արտեֆակտներին: System drift- ն սերտորեն կապված է ալգորիթմային խառնաշփոթի հետ կապված խնդրի հետ, որը ես կներգրավեմ 2.3.8 բաժնում:

Վերջում, շատ մեծ տվյալների աղբյուրները կախված են այն բանի շնորհիվ, թե ով է դրանք օգտագործում, թե ինչպես են դրանք օգտագործվում եւ ինչպես են աշխատում համակարգերը: Փոփոխության այդ աղբյուրները երբեմն հետաքրքիր հետազոտական ​​հարցեր են, բայց այդ փոփոխությունները բարդացնում են մեծ տվյալների աղբյուրների ունակությունը ժամանակի ընթացքում երկարաժամկետ փոփոխությունների հետեւելու համար: