2.3.2 हमेशा चालू

हमेशा चालू बड़ा डेटा अप्रत्याशित घटनाओं और वास्तविक समय माप के अध्ययन के लिए सक्षम बनाता है।

कई बड़े डेटा सिस्टम हमेशा पर कर रहे हैं; वे लगातार डेटा एकत्रित कर रहे हैं। यह हमेशा पर विशेषता अनुदैर्ध्य डेटा के साथ शोधकर्ताओं प्रदान करता है (यानी, समय के साथ डेटा)। हमेशा पर होने के नाते अनुसंधान के लिए दो महत्वपूर्ण प्रभाव पड़ता है।

सबसे पहले, डेटा संग्रह पर हमेशा शोधकर्ताओं को अप्रत्याशित घटनाओं का अध्ययन करने में सक्षम बनाता है जो अन्यथा संभव नहीं होते हैं। उदाहरण के लिए, 2013 की गर्मियों में तुर्की में कब्जे वाले गीज़ी विरोधों का अध्ययन करने में रुचि रखने वाले शोधकर्ता आम तौर पर घटना के दौरान प्रदर्शनकारियों के व्यवहार पर ध्यान केंद्रित करेंगे। सेरेन बुडक और डंकन वाट्स (2015) प्रदर्शनकारियों का अध्ययन करने के लिए ट्विटर की हमेशा प्रकृति का उपयोग करके और अधिक करने में सक्षम थे जिन्होंने घटना के पहले, दौरान और बाद में ट्विटर का उपयोग किया था। और, वे घटना के पहले, दौरान, और उसके बाद गैर-प्रतिभागियों के तुलना समूह बनाने में सक्षम थे (आंकड़ा 2.2)। कुल मिलाकर, उनके पूर्व-पोस्ट पैनल में दो वर्षों में 30,000 लोगों की ट्वीट शामिल थीं। इस अन्य जानकारी के विरोध में आम तौर पर इस्तेमाल किए गए डेटा को बढ़ाकर, बुडक और वाट्स बहुत कुछ सीखने में सक्षम थे: वे अनुमान लगा सकते थे कि किस तरह के लोगों को गीज़ी विरोधों में भाग लेने की संभावना है और इसके दृष्टिकोण में परिवर्तन का अनुमान लगाया जा सकता है प्रतिभागियों और गैर-प्रतिभागियों, दोनों अल्प अवधि में (पूर्व-गीज़ी की तुलना गीज़ी के दौरान) और लंबी अवधि में (पूर्व-गीज़ी के साथ पूर्व-गीज़ी की तुलना में)।

चित्रा 2.2: 2013 की गर्मियों में तुर्की में कब्जे वाले गीज़ी विरोधों का अध्ययन करने के लिए बुडक और वाट्स (2015) द्वारा डिजाइन किया गया। ट्विटर की हमेशा-प्रकृति प्रकृति का उपयोग करके, शोधकर्ताओं ने बनाया कि उन्होंने एक पूर्व-पोस्ट पैनल को किस बारे में बताया दो साल से 30,000 लोग। विरोध के दौरान प्रतिभागियों पर ध्यान केंद्रित करने वाले एक सामान्य अध्ययन के विपरीत, पूर्व-पोस्ट पैनल घटना से पहले और बाद में प्रतिभागियों से डेटा जोड़ता है और 2) घटना के पहले, दौरान, और बाद में गैर-प्रतिभागियों से डेटा। इस समृद्ध डेटा संरचना ने बुडक और वाट्स को यह अनुमान लगाने में सक्षम किया कि किस तरह के लोगों को गीज़ी विरोधों में भाग लेने की संभावना है और अल्प अवधि में प्रतिभागियों और गैर प्रतिभागियों के दृष्टिकोण में परिवर्तन का अनुमान लगाने के लिए (पूर्व-गीज़ी की तुलना में गीज़ी के दौरान ) और लंबी अवधि में (पोस्ट-गीज़ी के साथ पूर्व-गीज़ी की तुलना)।

चित्रा 2.2: 2013 की गर्मियों में तुर्की में कब्जे वाले गीज़ी विरोधों का अध्ययन करने के लिए Budak and Watts (2015) द्वारा डिजाइन किया गया। ट्विटर की हमेशा-प्रकृति प्रकृति का उपयोग करके, शोधकर्ताओं ने बनाया कि उन्होंने एक पूर्व-पोस्ट पैनल को किस बारे में बताया दो साल से 30,000 लोग। विरोध के दौरान प्रतिभागियों पर ध्यान केंद्रित करने वाले एक सामान्य अध्ययन के विपरीत, पूर्व-पोस्ट पैनल घटना से पहले और बाद में प्रतिभागियों से डेटा जोड़ता है और 2) घटना के पहले, दौरान, और बाद में गैर-प्रतिभागियों से डेटा। इस समृद्ध डेटा संरचना ने बुडक और वाट्स को यह अनुमान लगाने में सक्षम किया कि किस तरह के लोगों को गीज़ी विरोधों में भाग लेने की संभावना है और अल्प अवधि में प्रतिभागियों और गैर प्रतिभागियों के दृष्टिकोण में परिवर्तन का अनुमान लगाने के लिए (पूर्व-गीज़ी की तुलना में गीज़ी के दौरान ) और लंबी अवधि में (पोस्ट-गीज़ी के साथ पूर्व-गीज़ी की तुलना)।

एक संदिग्ध यह इंगित कर सकता है कि इनमें से कुछ अनुमान हमेशा डेटा संग्रह स्रोतों (उदाहरण के लिए, रवैया परिवर्तन के दीर्घकालिक अनुमान) के बिना किए जा सकते थे, और यह सही है, हालांकि 30,000 लोगों के लिए ऐसा डेटा संग्रह काफी होता महंगा। हालांकि, असीमित बजट भी दिया गया है, हालांकि, मैं किसी अन्य विधि के बारे में नहीं सोच सकता जो अनिवार्य रूप से शोधकर्ताओं को समय पर यात्रा करने की अनुमति देता है और अतीत में प्रतिभागियों के व्यवहार को सीधे देखता है। निकटतम विकल्प व्यवहार की पूर्वव्यापी रिपोर्ट एकत्र करना होगा, लेकिन ये रिपोर्ट सीमित ग्रैन्युलरिटी और संदिग्ध सटीकता से होगी। तालिका 2.1 अध्ययनों के अन्य उदाहरण प्रदान करता है जो एक अप्रत्याशित घटना का अध्ययन करने के लिए हमेशा डेटा स्रोत का उपयोग करते हैं।

तालिका 2.1: हमेशा बड़े डेटा स्रोतों का उपयोग करके अप्रत्याशित घटनाओं का अध्ययन।
अप्रत्याशित क्षण हमेशा डेटा स्रोत पर उद्धरण
तुर्की में गीज़ी आंदोलन पर कब्जा करो ट्विटर Budak and Watts (2015)
हांगकांग में छतरी विरोध प्रदर्शन Weibo Zhang (2016)
न्यूयॉर्क शहर में पुलिस की गोलीबारी स्टॉप-एंड-फ्रिस्क रिपोर्ट्स Legewie (2016)
आईएसआईएस में शामिल व्यक्ति ट्विटर Magdy, Darwish, and Weber (2016)
11 सितंबर 2001 हमले livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 सितंबर 2001 हमले पेजर संदेश Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

अप्रत्याशित घटनाओं का अध्ययन करने के अलावा, हमेशा बड़े डेटा सिस्टम शोधकर्ताओं को रीयल-टाइम अनुमान उत्पन्न करने में सक्षम करते हैं, जो नीतियों में महत्वपूर्ण हो सकते हैं जहां नीति निर्माताओं- सरकार या उद्योग में स्थितिगत जागरूकता के आधार पर प्रतिक्रिया देना चाहते हैं। उदाहरण के लिए, प्राकृतिक आपदाओं (Castillo 2016) आपातकालीन प्रतिक्रिया के मार्गदर्शन के लिए सोशल मीडिया डेटा का उपयोग किया जा सकता है और विभिन्न प्रकार के विभिन्न डेटा स्रोतों का उपयोग आर्थिक गतिविधि (Choi and Varian 2012) वास्तविक समय के अनुमानों का उत्पादन किया जा सकता है।

अंत में, हमेशा डेटा सिस्टम शोधकर्ताओं को अप्रत्याशित घटनाओं का अध्ययन करने और नीति निर्माताओं को वास्तविक समय की जानकारी प्रदान करने में सक्षम बनाता है। हालांकि, मुझे नहीं लगता कि हमेशा डेटा सिस्टम बहुत लंबे समय तक परिवर्तनों को ट्रैक करने के लिए उपयुक्त हैं। ऐसा इसलिए है क्योंकि कई बड़े डेटा सिस्टम लगातार बदल रहे हैं-एक प्रक्रिया जिसे मैं बाद में अध्याय (खंड 2.3.7) में बहाव कहूंगा।