2.3 मोठे डेटा सामान्य वैशिष्ट्ये

बिग डेटा स्रोत दहा वैशिष्ट्ये आहेत कल; काही सामाजिक संशोधन चांगले आहेत आणि काही वाईट आहेत.

संशोधक की निर्माण केले किंवा गोळा मोठा डेटा पासून जाणून घेण्यासाठी जात आहेत, तर त्यांनी त्याच्या सामान्य वैशिष्ट्ये समजून घेणे आवश्यक आहे. उलट व्यासपीठ दृष्टिकोण एक व्यासपीठ घेऊन पेक्षा (उदा, येथे आपण Twitter बद्दल माहित असणे आवश्यक आहे, येथे आपण Google शोध डेटा, इ बद्दल माहित असणे आवश्यक आहे), मी मोठे डेटा दहा सामान्य वैशिष्ट्ये, ऊठ वैशिष्ट्ये वर्णन करणार आहे कारण डेटा सामाजिक संशोधन हेतूने तयार केला नाही. प्रत्येक विशिष्ट प्रणाली तपशील परत पायउतार आणि या सर्वसाधारण गुणधर्म पाहून, संशोधक लवकर विद्यमान डेटा स्रोत अधिक जाणून घेण्यासाठी आणि भविष्यात डेटा स्रोत लागू कल्पना एक फर्म संच असू शकतात.

मी तो गट दोन श्रेणींमध्ये वैशिष्ट्ये उपयुक्त:

  • नेहमी, नॉन reactive मोठा, संशोधन साधारणपणे चांगला
  • संशोधन साधारणपणे वाईट: अपूर्ण प्रवेश, नॉन-प्रतिनिधी, drifting, अल्गोरिथमपणे: खी, प्रवेश गलिच्छ आणि संवेदनशील

सामान्यपणे बोलत, सरकार प्रशासकीय रेकॉर्ड कमी नॉन-प्रतिनिधी, कमी, अल्गोरिथमपणे खजील होऊन कमी प्रवाहित होणारे आहेत. दुसरीकडे, व्यवसाय प्रशासकीय रेकॉर्ड नेहमी मोठ्या आणि अधिक असू मानू लागले.