2.3.7 Drifting

მოსახლეობის დრიფტი, გამოყენებადი დრიფტი და სისტემა დრიფტი ძნელია გამოიყენოს დიდი მონაცემთა წყაროები გრძელვადიანი ტენდენციების შესასწავლად.

ბევრი დიდი მონაცემთა წყაროების ერთ-ერთი დიდი უპირატესობა ისაა, რომ ისინი დროთა განმავლობაში შეგროვდებიან მონაცემებს. სოციალური მეცნიერები ამ ტიპის უახლესი მონაცემების გრძელვადიან მონაცემებს უწოდებენ. და, ბუნებრივია, გრძივი მონაცემები ძალიან მნიშვნელოვანია ცვლილების შესასწავლად. ცვლილებების საიმედოდ შესამცირებლად, გაზომვის სისტემა უნდა იყოს სტაბილური. სოციოლოგის ოტის დუდლი დუნკანის სიტყვებით, "თუ ცვლილებების გაზომვა გსურთ, არ შეცვლის ღონისძიებას" (Fischer 2011) .

სამწუხაროდ, ბევრი დიდი მონაცემთა სისტემა, განსაკუთრებით ბიზნეს სისტემები - იცვლება ყველა დროის, პროცესი, რომელიც მე მოვუწოდებ დრიფტს . კერძოდ, ეს სისტემები ცვლის სამ ძირითად გზას: მოსახლეობის გადაადგილება (ცვლილება, რომელიც იყენებს მათ), ქცევითი დრეიტი (ცვლილება, თუ როგორ იყენებენ ადამიანები) და სისტემური გადაადგილება ( სისტემაში ცვლილება). დრიფტის სამი წყარო ნიშნავს იმას, რომ დიდი მონაცემთა წყაროში ნებისმიერი ნიმუში შეიძლება გამოიწვიოს მნიშვნელოვანი ცვლილება მსოფლიოში, ან ეს შეიძლება გამოიწვიოს რაიმე ფორმით დრიფტი.

დრიფტი-მოსახლეობის დრიფტის პირველი წყაროა გამოწვეული ცვლილებები, რომლებიც სისტემაში იყენებს და ეს ცვლილებები შეიძლება მოხდეს ორივე მოკლე და გრძელვადიან პერიოდში. მაგალითად, 2012 წლის აშშ-ის საპრეზიდენტო არჩევნების დროს ქალთა მიერ დაწერილი tweets- ის პროპორციით ყოველდღიურად მერყეობდა ქალები (Diaz et al. 2016) . ამრიგად, რა შეიძლება ითქვას, რომ Twitter- ლექსის განწყობის ცვლილება შესაძლოა რეალურად იყოს ცვლილება, რომელიც ნებისმიერ დროს საუბრობს. ამ მოკლევადიანი რყევების გარდა, არსებობს ასევე დემოგრაფიული ჯგუფების გრძელვადიანი ტენდენცია Twitter- ის მიღებისა და მიტოვების შესახებ.

გარდა ამისა, სისტემაში გამოყენებული ცვლილებების გარდა, ასევე არსებობს ცვლილებები, თუ როგორ გამოიყენება სისტემა, რომელიც მე მოვუწოდებ ქცევითი დრიფტით. მაგალითისთვის, 2013 წლის დეკემბერში თურქეთში Gezi საპროტესტო აქციის მონაწილეებმა მომიტინგეებმა შეიცვალა ჰაშიგატების გამოყენება, როგორც პროტესტი. აი როგორ Zeynep Tufekci (2014) აღწერილი ქცევითი დრიფტი, რომელიც მან შეძლო აღმოაჩინოს, რადგან იგი აკვირდებოდა ქცევის Twitter და პირადად:

"რა მოხდა ის, რომ როგორც კი პროტესტი დომინანტურ ამბად იქცა, დიდი რაოდენობით ადამიანი ... შეჩერდა ჰაშიგატების გამოყენებით, გარდა ახალი ფენომენით ყურადღების მიქცევა ... მიუხედავად იმისა, რომ საპროტესტო აქციები გაგრძელდა და კიდევ უფრო გაძლიერდა, ჰაშიგტგები გარდაიცვალა. ინტერვიუებმა გამოავლინეს ორი მიზეზი. პირველი, ერთხელ ყველას იცოდა თემა, hashtag იყო ერთდროულად ზედმეტი და wasteful on ხასიათი შეზღუდული Twitter პლატფორმა. მეორე, hashtags იყო მხოლოდ სასარგებლოა მოზიდვის ყურადღება კონკრეტული თემას, არა საუბარი ამის შესახებ. "

ამდენად, მკვლევარები, რომლებიც სწავლობდნენ მიერ საპროტესტო ანალიზის tweets საპროტესტო დაკავშირებული hashtags უნდა დამახინჯებული გაგებით რა ხდებოდა, რადგან ამ ქცევითი დრიფტი. მაგალითად, შესაძლოა, მათ მიაჩნიათ, რომ განხილვა საპროტესტო შემცირდა დიდი ხნით ადრე შემცირდა.

მესამე ტიპის დრიფტი არის სისტემა დრიფტი. ამ შემთხვევაში, ეს არ არის ხალხის შეცვლის ან მათი ქცევის შეცვლა, მაგრამ სისტემა თავად იცვლება. მაგალითად, დროთა განმავლობაში Facebook- მა გაზარდა სტატუსის განახლების სიგრძე. ამდენად, სტატუსის განახლების ნებისმიერი გრძივი შესწავლა დაუცველი იქნება ამ ცვლილებით გამოწვეული ნიმუშებისათვის. სისტემური დრიფტი მჭიდროდაა დაკავშირებული ალგორითმული კვანძების პრობლემასთან დაკავშირებით, რომელიც მე დაფარავს 2.3.8.

დაასკვნას, რომ ბევრი დიდი მონაცემთა წყარო იცვლება იმ ცვლილებების გამო, რომლებიც იყენებენ მათ, როგორ იყენებენ მათ და როგორ მუშაობს სისტემები. ცვლილების ეს წყაროები ზოგჯერ საინტერესო კვლევის კითხვებს წარმოადგენენ, მაგრამ ეს ცვლილებები გაართულებს დიდ მონაცემთა ბაზების შესაძლებლობას დროის გრძელვადიან ცვლილებებზე.