2.3.2 ყოველთვის

ყოველთვის დიდი მონაცემები საშუალებას შესწავლა მოულოდნელი მოვლენების და რეალურ დროში გაზომვა.

ბევრი დიდი მონაცემები სისტემები მუდამ; ისინი მუდმივად მონაცემთა შეგროვებას. ეს მუდმივი დამახასიათებელი უზრუნველყოფს მკვლევარები გრძივი მონაცემები (ანუ, მონაცემები დროთა განმავლობაში). როგორც ყოველთვის-on ორი მნიშვნელოვანი გავლენა კვლევა.

პირველ რიგში, მონაცემთა შეგროვება ყოველთვის მკვლევარებს საშუალებას აძლევს შეისწავლონ მოულოდნელი მოვლენები გზებზე, რომლებიც სხვაგვარად არ იქნება შესაძლებელი. მაგალითისთვის, 2013 წლის ზაფხულში თურქეთში ოკუპაციის გეზიში შესწავლილი მკვლევარები დაინტერესდებიან, როგორც წესი, აქციის მონაწილეების ქცევაზე. Ceren Budak და Duncan Watts (2015) შეძლეს უფრო მეტი გამოყენებით Twitter- ის ბუნების გამოყენებით, რათა შეისწავლონ დემონსტრანტები, რომლებიც იყენებდნენ Twitter- ს, დროს და მოვლენის შემდეგ. და მათ შეძლეს შექმნან შედარებადი მონაწილეთა ჯგუფი ადრე, დროს და მოვლენის შემდეგ (ფიგურა 2.2). საერთო ჯამში, მათი ყოფილი პოსტი პანელი შედის tweets 30,000 ადამიანი ორი წლის განმავლობაში. ამ ინფორმაციის სხვა საშუალებებით გავრცელებული მონაცემების გაზრდის გზით, ბუდაკმა და ვატსმა შეძლეს გაცილებით უფრო მეტი გაიგონეს: მათ შეეძლოთ შეაფასონ რა სახის ადამიანები უფრო მეტად იყვნენ მონაწილეობდნენ გეზიში საპროტესტო აქციებში და შეაფასებდნენ ცვლილებებს მონაწილეები და არაპარტნიორები, როგორც მოკლევადიან პერსპექტივაში (გეზიზე წინასწარ გეზი შედარებით) და გრძელვადიან პერსპექტივაში (წინასწარი გეზი, პოსტ-გეზითან შედარებით).

ფიგურა 2.2: ბუდაკისა და ვატის (2015) მიერ გამოყენებული დიზაინი 2013 წლის ზაფხულში თურქეთში ოკუპაციის გეზიში შესასწავლად. Twitter- ის მუდმივი ხასიათის გამოყენებით, მკვლევარებმა შეიმუშავეს ის, რასაც ისინი ე.წ პოსტ პანელს უწოდებდნენ ორი წლის განმავლობაში 30,000 ადამიანი. გამოკვლევების დროს მონაწილეთა მხრიდან ფოკუსირებული ტიპური სწავლებისგან განსხვავებით, პოსტ-პანელი დასძენს 1) მონაწილეს მონაწილებებისაგან მონაცემები და მოვლენის დასრულებამდე და 2) მონაცემები არასრულწლოვანთაგან, მოვლენების შემდგომ, და მის შემდეგ. ამ გამდიდრებული მონაცემების სტრუქტურა საშუალებას აძლევდა ბადაკმა და ვატსმა შეაფასეს, თუ რა სახის ადამიანები უფრო მეტად იყვნენ მონაწილეობდნენ გეზიში საპროტესტო აქციებში და შეაფასებდნენ მონაწილეებსა და არა მონაწილეებს, როგორც მოკლევადიან პერსპექტივაში (წინასწარ გეზი ) და გრძელვადიან პერსპექტივაში (წინასწარ გეზის პოსტ-გეზითან შედარება).

ფიგურა 2.2: Budak and Watts (2015) მიერ გამოყენებული დიზაინი 2013 წლის ზაფხულში თურქეთში ოკუპაციის გეზიში შესასწავლად. Twitter- ის მუდმივი ხასიათის გამოყენებით, მკვლევარებმა შეიმუშავეს ის, რასაც ისინი ე.წ პოსტ პანელს უწოდებდნენ ორი წლის განმავლობაში 30,000 ადამიანი. გამოკვლევების დროს მონაწილეთა მხრიდან ფოკუსირებული ტიპური სწავლებისგან განსხვავებით, პოსტ-პანელი დასძენს 1) მონაწილეს მონაწილებებისაგან მონაცემები და მოვლენის დასრულებამდე და 2) მონაცემები არასრულწლოვანთაგან, მოვლენების შემდგომ, და მის შემდეგ. ამ გამდიდრებული მონაცემების სტრუქტურა საშუალებას აძლევდა ბადაკმა და ვატსმა შეაფასეს, თუ რა სახის ადამიანები უფრო მეტად იყვნენ მონაწილეობდნენ გეზიში საპროტესტო აქციებში და შეაფასებდნენ მონაწილეებსა და არა მონაწილეებს, როგორც მოკლევადიან პერსპექტივაში (წინასწარ გეზი ) და გრძელვადიან პერსპექტივაში (წინასწარ გეზის პოსტ-გეზითან შედარება).

სკეპტიკურად შეიძლება აღინიშნოს, რომ ზოგიერთი ამ მონაცემების შეფასების გარეშე შესაძლებელი იყო მონაცემთა შეგროვების წყაროების გარეშე (მაგალითად, დამოკიდებულების ცვლილების გრძელვადიანი შეფასებები) და ეს სწორია, თუმცა ასეთი მონაცემების შეგროვება 30,000 ადამიანს ექნებოდა ძვირია. მაშინაც კი, შეუზღუდავი ბიუჯეტიც კი არ მიმაჩნია, რომ სხვა მეთოდებიც კი არ არის შესაძლებელი, რაც საშუალებას იძლევა მკვლევარებს დროულად დაუბრუნონ და უშუალოდ დაიცვან მონაწილეთა ქცევა წარსულში. უახლოესი ალტერნატივა იქნებოდა ქცევის რეტროსპექტული ანგარიშების შეგროვება, მაგრამ ეს ანგარიშები იქნებოდა შეზღუდული გრანულურობა და საეჭვო სიზუსტე. ცხრილი 2.1 უზრუნველყოფს სწავლის სხვა მაგალითებს, რომლებიც ხშირად იყენებენ მონაცემთა წყაროს, რათა შეისწავლონ მოულოდნელი მოვლენა.

ცხრილი 2.1: უჩვეულო მოვლენების კვლევა ყოველთვის დიდი მონაცემთა წყაროების გამოყენებით.
მოულოდნელი მოვლენა ყოველთვის - მონაცემთა წყაროზე ციტირება
გეზი მოძრაობა თურქეთში Twitter Budak and Watts (2015)
ქოლგა საპროტესტო აქციები ჰონგ კონგში Weibo Zhang (2016)
ნიუ-იორკში პოლიციის სროლები Stop-and-frisk ანგარიშები Legewie (2016)
პირი ISIS- ში გაწევრიანებას Twitter Magdy, Darwish, and Weber (2016)
2001 წლის 11 სექტემბრის თავდასხმა livejournal.com Cohn, Mehl, and Pennebaker (2004)
2001 წლის 11 სექტემბრის თავდასხმა პეიჯერი შეტყობინებები Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

გარდა იმისა, რომ მოულოდნელი მოვლენების შესწავლა, ყოველთვის დიდ მონაცემთა სისტემებში, მკვლევარებს საშუალებას აძლევს რეალურ დროში შეაფასონ, რაც შეიძლება მნიშვნელოვანი იყოს იმ პარამეტრებში, სადაც პოლიტიკოსები - მთავრობაში ან ინდუსტრიაში - სიტუაციის გაცნობიერების საფუძველზე რეაგირება სურთ. მაგალითად, სოციალური მედიის მონაცემები შეიძლება გამოყენებულ იქნას ბუნებრივი კატასტროფების (Castillo 2016) გადაუდებელი რეაგირებისთვის და სხვადასხვა დიდი მონაცემთა წყაროების გამოყენება შეიძლება გამოყენებულ იქნას ეკონომიკური აქტივობის რეალურ დროში შეფასებებზე (Choi and Varian 2012) .

საბოლოო ჯამში, მონაცემთა სისტემაში ყოველთვის იძლევა მკვლევარებს, შეისწავლონ მოულოდნელი მოვლენები და უზრუნველყონ რეალურ დროში ინფორმაცია პოლიტიკოსებისათვის. მე არ ვფიქრობ, რომ ყოველთვის მონაცემთა სისტემებს კარგად შეეფერება დროთა მანძილზე ცვლილებების თვალსაზრისით. ეს იმიტომ, რომ ბევრი დიდი მონაცემთა სისტემა მუდმივად იცვლება - პროცესი, რომელსაც მე მოვუწოდებ დრიფტის შემდეგ (თავი 2.3.7).