2.3 ठूलो डेटा को दस साधारण विशेषताहरु

ठूला डेटा स्रोतहरूसँग सामान्यमा धेरै विशेषताहरू हुन्छन्; केहि सामान्यतया सोशल अनुसन्धानको लागि राम्रो हुन्छ र केहि सामान्यतया खराब छन्।

यद्यपि प्रत्येक ठूलो डेटा स्रोत फरक छ, यो उपयोगी हुन सक्छ कि त्यहाँ केहि विशेषताहरू छन् जुन फेरि र फेरि हुन्छ। त्यसैले, प्लेटफार्मद्वारा प्लेटफार्मको दृष्टिकोण लिनुको सट्टा (जस्तै, यहाँ तपाईले ट्विटरको बारे जान्न आवश्यक छ, यहाँ के तपाईलाई Google खोज डेटा, आदि बारे जान्न आवश्यक छ), म ठूलो को दस सामान्य विशेषताहरु को वर्णन गर्न जाँदैछु। डेटा स्रोतहरू। प्रत्येक विशेष प्रणालीको विवरणबाट फिर्ता लिनुहोस् र यी सामान्य विशेषताहरूलाई हेर्दा शोधकर्ताहरू लाई चाँडै अवस्थित डेटा स्रोतहरू बारे सिक्न र भविष्यमा सिर्जना हुने डेटा स्रोतहरूमा लागू गर्न फर्म सेटहरू बारे सिक्न सक्षम पार्दछ।

यद्यपि एक स्रोत स्रोत को इच्छित विशेषता अनुसन्धान अनुसन्धान मा निर्भर गर्दछ, म यसलाई उपयोगी गर्न को लागि उपयोगी छ कि दस विशेषताहरु को दुई विस्तृत श्रेणिहरु मा समूह:

  • सामान्यतया अनुसन्धानको लागि सहयोगी: ठूलो, सचेत, र अनावश्यक
  • सामान्यतया अनुसन्धानको लागि समस्याग्रस्त: अपूर्ण, अनुपलब्ध, nonrepresentative, बहाव, एल्गोरिदममिक रूपले भंग भयो, गन्दा, र संवेदनशीलता

मैले यी विशेषताहरू वर्णन गरिरहँदा तपाईंले सूचना दिनुहुनेछ कि तिनीहरू अक्सर उत्पन्न हुन्छन् किनभने अनुसन्धानको उद्देश्यका लागि ठूला डेटा स्रोतहरू सिर्जना भएनन्।