2.3.7 प्रवाहित

लोकसंख्या वाहून नेणे, वापर प्रवाह, आणि प्रणालीच्या प्रवाहामुळे दीर्घकालीन ट्रेन्डचा अभ्यास करण्यासाठी मोठ्या डेटा स्त्रोत वापरणे कठिण होते.

बर्याच मोठ्या डेटा स्रोतांचे एक उत्तम फायदे म्हणजे ते वेळोवेळी डेटा गोळा करतात. सामाजिक शास्त्रज्ञ अशा प्रकारचे ओव्हर-टाइम डेटा रेखांशाचा डेटा कॉल करतात . आणि, नैसर्गिकरित्या, बदल अभ्यास करण्यासाठी अनुदानाचा डेटा अतिशय महत्वाचा असतो. बदल घट्टपणे मोजण्यासाठी, मोजमाप प्रणाली स्वतःच स्थीर असणे आवश्यक आहे. समाजशास्त्रज्ञ ओटिस डडले डंकनच्या शब्दात, "आपण बदल मोजू इच्छित असल्यास, उपाय बदलू नका" (Fischer 2011) .

दुर्दैवाने, अनेक मोठे डेटा प्रणाली-विशेषत: सर्व वेळ बदलत्या व्यावसायिक आहेत-प्रणाली, मी वाहून नेणे कॉल करू की एक प्रक्रिया. विशेषतः, ही प्रणाली तीन मुख्य पद्धतींमध्ये बदलते: लोकसंख्या वाहून नेणे (कोण वापरत आहे त्यात बदल), वर्तणुकीच्या प्रवाहामुळे (लोक कसे वापरत आहेत ते बदलतात), आणि प्रणालीची प्रवाहाची ( प्रणालीमध्ये बदल) प्रवाहाचे तीन स्रोत याचा अर्थ असा की एखाद्या मोठ्या डेटा स्रोतातील कोणत्याही नमुन्यामुळे जगातील महत्त्वाच्या बदलामुळे होऊ शकतील किंवा ते कोणत्याही प्रवाहामुळे होऊ शकते.

प्रवाशांच्या लोकसंख्येच्या प्रवाहाचा पहिला स्त्रोत-प्रणालीचा वापर करत असलेल्या बदलांमुळे होतो, आणि हे बदल लहान आणि दीर्घ काळाच्या दोन्ही बाबतीत होऊ शकतात. उदाहरणार्थ, अमेरिकेच्या 2012 च्या राष्ट्रपतिपदाच्या निवडणुकीदरम्यान स्त्रियांनी लिहिलेल्या राजकारणाबद्दलच्या ट्विट्सच्या प्रमाणात दिवस-दर-दिवस चढ-उतार होते (Diaz et al. 2016) . त्यामुळे, Twitter- पद्य च्या मूड मध्ये एक बदल असल्याचे दिसत शकते काय प्रत्यक्षात कोणत्याही क्षणी बोलत आहे मध्ये एक बदल असू शकते. या अल्पकालीन चढउतारांव्यतिरिक्त, काही विशिष्ट लोकसंख्याशास्त्रीय संघांचा एक दीर्घकालीन प्रवृत्ती आहे जो कि ट्विटर वापरुन सोडून दिलेला आहे.

प्रणाली वापरत असलेल्या बदलांच्या व्यतिरीक्त, प्रणाली कशी वापरली जाते यातील बदल देखील आहेत, ज्यास मी वर्तणुकीशी प्रवाह म्हणतो. उदाहरणार्थ, 2013 मध्ये तुर्कस्तानमध्ये ऑब्जूजी गेझी निषेध दरम्यान, आंदोलकांनी हॅशटॅग्सचा वापर बदलला, कारण निषेध उत्क्रांत झाला. Zeynep Tufekci (2014) ने वर्तणुकीच्या प्रवाहाचे वर्णन केले आहे जे ती ट्विटरवर आणि व्यक्तीमधे वर्तणूक पाहत असल्यामुळे ती शोधण्यात सक्षम होती.

"जे घडले तेवढ्याच निषेध हा महत्त्वाकांक्षी कथा बनल्याबरोबर मोठ्या संख्येने लोक ... नवीन इतिहासावर लक्ष ठेवण्याशिवाय हॅशटॅगचा वापर करणे थांबवले ... जेव्हा विरोध प्रदर्शन चालूच राहिले, आणि तेही वाढले, तेव्हा हॅशटॅग मरत गेले. मुलाखती या दोन कारणांवरून दिसून आले. प्रथम, एकदा प्रत्येकाने विषयाला ओळखले की, एकदा हॅशटॅग वर्ण-सीमित ट्विटर प्लॅटफॉर्मवर अनावश्यक आणि अनावश्यक होती. दुसरी, हॅशटॅग केवळ एखाद्या विशिष्ट विषयाकडे लक्ष वेधण्यासाठी उपयुक्त होते, परंतु त्याबद्दल बोलण्याकरिता नाही. "

त्यामुळे निषेध संबंधित हॅशटॅग्ज ट्वीट विश्लेषण करून निषेध शिकत होते कोण संशोधक कारण या वर्तणुकीशी वाहून नेणे या काय एक अस्पष्ट अर्थ आहे. उदाहरणार्थ, ते प्रत्यक्षात कमी आधी निषेध चर्चा लांब कमी विश्वास ठेवावा.

प्रवाहाचे तिसरे प्रकार म्हणजे प्रणालीचे प्रवाही या प्रकरणात, लोक बदलत नाहीत किंवा त्यांचे वर्तन बदलत नाही, तर ही प्रणाली स्वतः बदलत आहे. उदाहरणार्थ, वेळोवेळी फेसबुक ने स्थिती अद्यतनांच्या कालावधीची मर्यादा वाढविली आहे. अशाप्रकारे, स्थिती बदलांचा कोणताही अनुदानाचा अभ्यास हा बदल झाल्याने होणार्या कलाकृतींसाठी असुरक्षित असेल. यंत्रावरील प्रवाहाला अल्गोरिदमिक गोंधळात टाकणा या अडचणीशी जवळून संबंध आहे, जे मी विभाग 2.3.8 मध्ये अंतर्भूत करेल.

निष्कर्षापर्यंत, बरेच मोठे डेटा स्रोत हे वापरत आहेत ते कसे वापरतात, आणि ते कसे कार्य करतात त्यामधील बदलांमुळे बदलत आहेत. या बदलाचे हे स्रोत काहीवेळा मनोरंजक संशोधन प्रश्न आहेत, परंतु हे बदल वेळोवेळी दीर्घकालीन बदलांचा मागोवा घेण्यासाठी मोठ्या डेटा स्त्रोतांच्या क्षमतेला कठीण करतात.