2.3.2 नेहमी-चालू

नेहमी-मोठ्या डेटा प्रसंग आणि रिअल-टाइम मापन अभ्यास सक्षम करते.

अनेक मोठे डेटा प्रणाली नेहमी आहेत; ते सतत माहिती गोळा आहेत. या नेहमी वैशिष्ट्यपूर्ण रेखांशाचा डेटा संशोधक उपलब्ध आहे (म्हणजेच, वेळ डेटा). नेहमी जात संशोधन दोन महत्त्वाचे मानले आहे.

प्रथम, नेहमीच्या डेटा संग्रहाने शोधकांना अनपेक्षित घटनांचे अभ्यासाचे मार्ग शोधण्यास सक्षम करते ज्या अन्यथा शक्य होणार नाहीत. उदाहरणार्थ, 2013 च्या उन्हाळ्यात तुर्कस्तानमध्ये गेओजी व्यापाराचे स्वामित्व अभ्यास करण्यात रस घेणाऱ्या संशोधक विशेषत: या कार्यक्रमादरम्यान निदर्शकांच्या वागणुकीवर लक्ष केंद्रित करतील. ट्विटर बॅनर आणि डंकन वॅट्स (2015) ट्विटरच्या नेहमीच्या प्रकृतिचा वापर करून ते स्पर्धेच्या आधी, दरम्यान आणि नंतर ट्विटरचा वापर करणार्या निदर्शकांचा अभ्यास करण्यासाठी अधिक सक्षम होते. आणि, इव्हेंटच्या आधी, दरम्यान आणि नंतर (आकृती 2.2) ते गैर-सहभागींच्या तुलना गटात तयार करण्यास सक्षम होते. एकूण, त्यांच्या माजी पॅनलमध्ये दोन वर्षांच्या कालावधीत 30,000 लोकांच्या ट्विट्सचा समावेश होता. या इतर माहितीसह सामान्यतः वापरल्या जाणार्या डेटाला वाढवून, बुडाक व वॉट्स हे अधिक जाणून घेण्यास सक्षम होते: ते अंदाज लावण्यात सक्षम होते की कोणत्या प्रकारच्या लोकांना लोकजगतातील निषेधार्थ होण्याची जास्त शक्यता असते आणि त्यांच्या वर्तणुकीत बदल करणे सहभागी आणि नॉनपेप्रिंटंट, दोन्ही अल्प मुदतीत (Gezi दरम्यान पूर्व Gezi तुलना) आणि दीर्घकालीन (पोस्ट Gezi सह पूर्व Gezi तुलना) दोन्ही.

चित्रा 2.2: बुक्कक व वॉट्स (2015) द्वारे वापरण्यात येणारे डिझाइन, 2013 च्या उन्हाळ्यात तुर्कस्तानमध्ये ऑक्सिफी गॅझी विरोधांचे अध्ययन करतात. ट्विटरच्या नेहमीच्या निसर्गाचा वापर करून, संशोधकांनी तयार केलेले एक तयार केलेले पोस्ट-पोस्ट पॅनेल दोन वर्षांत 30,000 लोक. निषेधाच्या वेळी सहभागींवर केंद्रित असलेल्या एका विशिष्ट अभ्यासाच्या विरोधात, माजी पोस्ट पॅनेल 1) डेटा आधी आणि नंतर सहभागी झालेल्यांचा डेटा आणि 2) इव्हेंटच्या आधी, दरम्यान आणि नंतर गैर-सहभागींच्या डेटाचा समावेश करते. या समृद्ध डेटा संरचनाने बुडक व वॉट्स यांना अंदाज लावला की कोणत्या प्रकारच्या लोकांना जाझींच्या निषेधांमध्ये सहभागी होण्याची शक्यता होती आणि अल्प कालावधीमध्ये सहभागी आणि गैर-सहभागींच्या वर्तणुकीत बदल घडवून आणण्याची शक्यता वाढली (Gezi दरम्यान पूर्व Gezi तुलना करणे ) आणि दीर्घकालीन (पूर्व- Gezi पोस्ट Gezi सह तुलना).

चित्रा 2.2: Budak and Watts (2015) द्वारे वापरण्यात येणारे डिझाइन, 2013 च्या उन्हाळ्यात तुर्कस्तानमध्ये ऑक्सिफी गॅझी विरोधांचे अध्ययन करतात. ट्विटरच्या नेहमीच्या निसर्गाचा वापर करून, संशोधकांनी तयार केलेले एक तयार केलेले पोस्ट-पोस्ट पॅनेल दोन वर्षांत 30,000 लोक. निषेधाच्या वेळी सहभागींवर केंद्रित असलेल्या एका विशिष्ट अभ्यासाच्या विरोधात, माजी पोस्ट पॅनेल 1) डेटा आधी आणि नंतर सहभागी झालेल्यांचा डेटा आणि 2) इव्हेंटच्या आधी, दरम्यान आणि नंतर गैर-सहभागींच्या डेटाचा समावेश करते. या समृद्ध डेटा संरचनाने बुडक व वॉट्स यांना अंदाज लावला की कोणत्या प्रकारच्या लोकांना जाझींच्या निषेधांमध्ये सहभागी होण्याची शक्यता होती आणि अल्प कालावधीमध्ये सहभागी आणि गैर-सहभागींच्या वर्तणुकीत बदल घडवून आणण्याची शक्यता वाढली (Gezi दरम्यान पूर्व Gezi तुलना करणे ) आणि दीर्घकालीन (पूर्व- Gezi पोस्ट Gezi सह तुलना).

एक संशयवादी असे सूचित करतात की यांपैकी काही अनुमान नेहमी नेहमीच डेटा संग्रह स्त्रोतांशिवाय (उदा. वृत्ती बदलाचे दीर्घकालीन अंदाज) केले जाऊ शकत नव्हते, आणि ते योग्य आहे, तरीही 30,000 लोकांसाठी असा डेटा संकलन टाळला असता. महाग जरी अमर्यादित अर्थसंकल्पास दिले असले तरीही, मी इतर कोणत्याही पद्धतीचा विचार करू शकत नाही ज्यामुळे संशोधक वेळेत मागे प्रवास करण्यास आणि भूतकाळात सहभागींच्या वर्तनाला प्रत्यक्षपणे नकार देतात. सर्वात जवळचा पर्याय वागणुकीच्या पूर्वव्यापी अहवाल एकत्रित करणे हे असेल, परंतु हे अहवाल मर्यादित ग्रॅन्युलॅरिटी आणि शंकास्पद अचूकतेचे असतील. टेबल 2.1 अभ्यासाची इतर उदाहरणे उपलब्ध करते जी अनपेक्षित घटनांचा अभ्यास करण्यासाठी नेहमीच्या डेटा स्रोताचा वापर करतात.

तक्ता 2.1: नेहमी-मोठ्या डेटा स्त्रोतांचा वापर करून अनपेक्षित घटनांचे अभ्यास
अनपेक्षित घटना नेहमी-चालू असलेल्या डेटा स्त्रोत उद्धरण
तुर्की मध्ये Gezi चळवळ व्यापारात ट्विटर Budak and Watts (2015)
हाँगकाँगमधील छत्रछायेच्या निषेधार्थ वेइबो Zhang (2016)
न्यू यॉर्क शहर पोलिसांची शूटिंग थांबा आणि खिडकी अहवाल Legewie (2016)
ISIS मध्ये सामील होणारी व्यक्ती ट्विटर Magdy, Darwish, and Weber (2016)
सप्टेंबर 11, 2001 हल्ला livejournal.com Cohn, Mehl, and Pennebaker (2004)
सप्टेंबर 11, 2001 हल्ला पेजर संदेश Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

अनपेक्षित घटनांचा अभ्यास करण्याव्यतिरिक्त, नेहमीच मोठ्या डेटा प्रणालीद्वारे संशोधकांना वास्तविक-वेळ अंदाज तयार करण्यास सक्षम केले जाते, जे धोरण किंवा धोरणांमध्ये नीति-निर्मात्यांमध्ये महत्त्वाचे असू शकतात- प्रसंगनिष्ठ जागरूकता आधारित आधारित प्रतिसाद देऊ इच्छितो. उदाहरणार्थ, नैसर्गिक आपत्ती (Castillo 2016) आपत्कालीन प्रतिसाद मार्गदर्शनासाठी सामाजिक मीडिया डेटाचा वापर केला जाऊ शकतो आणि विविध मोठ्या डेटा स्त्रोतांची विविधता वापरली जाऊ शकते आर्थिक गतिविधि (Choi and Varian 2012) वास्तविक-वेळ अंदाज तयार करण्यासाठी.

शेवटी, नेहमीच्या डेटा सिस्टम संशोधकांना अनपेक्षित घटनांचा अभ्यास करण्यास आणि धोरण निर्मात्यांना वास्तविक-वेळ माहिती प्रदान करण्यास सक्षम करतात. तथापि, असे नाही की मला नेहमी असे वाटते की नेहमीच्या काळात डेटा सिस्टम ही बर्याच काळातील बदलांवर मागोवा घेण्याकरिता अनुकूल असतात. अनेक मोठे डेटा प्रणाली सतत बदलत-एक आहेत कारण मी नंतर प्रकरण (विभाग 2.3.7) मध्ये पडणे कॉल करू की प्रक्रिया आहे.