2.3.7 बहाव

जनसंख्या बहाव, उपयोग बहाव, र प्रणाली बहावले लामो समय सम्मको स्रोतहरू प्रयोग गर्न ठूलो डेटा स्रोतहरू प्रयोग गर्न कठिन बनाउँछ।

धेरै ठूला डेटा स्रोतहरूको ठूलो फाइदा भनेको हो कि तिनीहरू समयको साथ डेटा एकत्र गर्छन्। सामाजिक वैज्ञानिकहरूले यस प्रकारको ओभर-टाइम डाटा लिमिटरेट डाटालाई बोलाउँछन्। र, स्वाभाविक रूप देखि, परिवर्तन को अध्ययन को लागि लंबी अवधि को डेटा धेरै महत्वपूर्ण छ। राम्रो तरिकाले परिवर्तन मापन गर्न, तथापि, माप प्रणाली आफै स्थिर हुनुपर्छ। समाजशास्त्री ओटीट डडली डन्कनका शब्दहरूमा, "यदि तपाईं परिवर्तन गर्न चाहानुहुन्छ, उपाय परिवर्तन नगर्नुहोस्" (Fischer 2011)

दुर्भाग्यवश, धेरै ठूला डाटा प्रणालीहरू - विशेषतया व्यवसायिक प्रणालीहरू - सबै समय परिवर्तन हुँदैछ, एक प्रक्रियामा म बहाव कल गर्नेछु। विशेष गरी यी प्रणालीहरू तीन मुख्य तरिकाहरूमा परिवर्तन हुन्छन्: आबादी बहाव (उनीहरूले प्रयोग गर्नाले परिवर्तन), व्यवहार बहाव (कसरी उनीहरूले प्रयोग गर्दै हुनुहुन्छ भनेर परिवर्तन गर्दछ), र प्रणाली बहाव ( प्रणालीमा परिवर्तन गर्दछ)। बहावको तीन स्रोतहरू भनेको ठूलो डेटा स्रोतमा कुनै पनि ढाँचा विश्वमा महत्त्वपूर्ण परिवर्तनको कारण हुनसक्छ, वा यो बहावको केही कारणले गर्दा हुन सक्छ।

बहाव-आबादीको बहावको पहिलो स्रोत - प्रणालीको प्रयोग गर्ने क्रममा परिवर्तनहरू हुनसक्छ, र यी परिवर्तनहरू दुवै छोटो र लामो समयका क्यारेक्टरहरूमा हुन सक्छ। उदाहरणको लागि, 2012 को अमेरिकी राष्ट्रपति चुनावको समयमा, महिलाहरु द्वारा लिखित राजनीतिको बारेमा ट्वीट्सको अनुपात दिन दिन दिन (Diaz et al. 2016) । त्यसैले, Twitter-verse को मूडमा परिवर्तन हुन सक्छ कुन वास्तवमा कुनै पनि क्षणमा कुरा गरिरहेको परिवर्तन हुन सक्छ। यी छोटो अवधि को उतार-चढ़ाव को अतिरिक्त, वहाँ केहि जनसांख्यिकीय समूह को एक लंबी अवधि को रुझान को गोद लेने र चहचहाना छोड दिए छ।

प्रणालीको प्रयोग गर्ने परिवर्तनहरूको अतिरिक्त, त्यहाँ प्रणाली कसरी प्रयोग गरिन्छ भन्ने परिवर्तनहरू छन्, जुन मैले व्यवहार बहावलाई बोलाउँछु। उदाहरणका लागि, 2013 मा टर्कीमा गीडीको अपहरणमा परेका प्रदर्शनका क्रममा, प्रदर्शनकारीले हङकङको प्रयोगको विरोध प्रदर्शनको रूपमा परिवर्तन गरे। यहाँ छ कसरी Zeynep Tufekci (2014) व्यवहार व्यवहार बहाव, जसलाई उनि पत्ता लगाउन सक्षम थिए वर्णन गरे किनभने उनी ट्विटर र व्यक्तिमा व्यवहार देखिरहेका थिए:

"के हो यो थियो कि चाँडै विरोधको मूल कथा बन्छ, ठूलो संख्यामा मान्छे ... ह्याजगेटको प्रयोग रोक्न एक नयाँ घटनालाई ध्यान नदिने बाहेक ... विरोधाभासहरू निरन्तरता र तीव्रताले गर्दा ह्याशग्सले मर्यो। साक्षात्कारहरूले यसको लागि दुई कारण बताए। पहिलो, सबैले विषयलाई थाहा पाएपछि, हताहत एक पटक एकदम राम्रो थियो र क्यारेक्टर-सीमित चहचहाना प्लेटफर्ममा अपमानजनक थियो। दोस्रो, हैशगहरू केवल एक विशेष विषयमा ध्यान आकर्षित गर्न उपयोगी को रूप मा देख्न को लागि, यसको बारे मा कुरा गर्न को लागी। "

तसर्थ, विरोध-सम्बन्धित hashtags संग ट्विट विश्लेषण गरेर विरोध गर्ने अध्ययन थिए अनुसन्धानकर्ताहरूले किनभने यो व्यवहार बहाव को के भइरहेको थियो को एक विकृत अर्थमा हुनेछ। उदाहरणका लागि, तिनीहरूले वास्तवमा घट्यो अघि विरोध को चर्चा लामो घट्यो भनेर विश्वास सक्छ।

तेस्रो किसिमको बहाव प्रणाली बहाव हो। यस अवस्थामा, यो मान्छे परिवर्तन वा तिनीहरूको व्यवहार परिवर्तन छैन, तर प्रणाली आफै परिवर्तन। उदाहरणका लागि, फेसबुकको साथमा स्टेटस अद्यावधिकहरूको लम्बाईमा सीमा बढ्यो। यसकारण, स्टेटस अपडेटहरूको कुनै पनि लामो समयसम्म अध्ययनले यो परिवर्तनको कारण कलाकृतिहरू कमजोर हुन सक्छ। प्रणाली बहाव एल्गोरिदमिक बुझाईएको समस्याको नजिकसँग सम्बन्धित छ, जुन म खण्डमा 2.3.8।

अन्त्य गर्न, धेरै ठूला डेटा स्रोतहरू तिनीहरूका प्रयोग गर्नेहरू, कसरी प्रयोग भइरहेको छ, र प्रणाली कसरी काम गर्ने जस्ता परिवर्तनहरूको कारण बढ्दै जान्छ। परिवर्तनका यी स्रोतहरू कहिलेकाहीँ रोचक अनुसन्धानका प्रश्न हुन्, तर यी परिवर्तनहरू समयको साथमा लामो-समय परिवर्तनहरू ट्र्याक गर्न ठूला डेटा स्रोतहरूको क्षमता जटिल पार्छन्।