2.3 பெரிய தரவுகளின் பத்து பொதுவான பண்புகள்

பெரிய தரவு ஆதாரங்கள் பொதுவான பல பண்புகளை கொண்டிருக்கின்றன; சிலர் பொதுவாக சமூக ஆராய்ச்சிக்கு நல்லவர்கள், சிலர் பொதுவாக மோசமானவர்கள்.

ஒவ்வொரு பெரிய தரவு மூலமும் தனித்துவமானதாக இருந்தாலும் கூட, மீண்டும் மீண்டும் மீண்டும் ஏற்படக்கூடிய சில சிறப்பியல்புகள் இருப்பதை கவனிக்க உதவுகிறது. எனவே, ஒரு மேடையில் மூலம் மேடையில் அணுகுமுறை (எ.கா., இங்கே நீங்கள் ட்விட்டர் பற்றி தெரிந்து கொள்ள வேண்டும் என்ன, இங்கே நீங்கள் Google தேடல் தரவு பற்றி தெரிந்து கொள்ள வேண்டும் என்ன), நான் பெரிய பத்து பொது பண்புகள் விவரிக்க போகிறேன் தரவு மூலங்கள். ஒவ்வொரு குறிப்பிட்ட கணினியின் விவரங்களிலிருந்தும் திரும்பப் பெறுதல் மற்றும் இந்த பொதுவான பண்புகளை ஆராய்தல் ஆராய்ச்சியாளர்கள் விரைவாக இருக்கும் தரவு மூலங்களைப் பற்றி அறிந்து கொள்வதற்கும் எதிர்காலத்தில் உருவாக்கப்படும் தரவு ஆதாரங்களுக்கும் பொருந்தக்கூடிய ஒரு யோசனைகளின் யோசனைகளையும் வழங்குகிறது.

ஒரு தரவு மூலத்தின் தேவையான பண்புகள் ஆராய்ச்சிக்கான இலக்கைச் சார்ந்து இருந்தாலும், பத்து குணங்களை இரண்டு பரந்த பிரிவுகளாக குழப்பிக் கொள்ள உதவுகிறது:

  • ஆராய்ச்சிக்கு பொதுவாக உதவுகிறது: பெரிய, எப்போதும்-மீது, மற்றும் nonreactive
  • பொதுவாக ஆராய்ச்சிக்கு சிக்கலானது: முழுமையற்ற, அணுக முடியாதது, குறிக்கப்படாதது, டிரிஃப்டிங், அல்காரிக்டிமிகளால் குழப்பம், அழுக்கு மற்றும் உணர்திறன்

இந்த பண்புகளை நான் விவரிப்பது போல, அவர்கள் பெரும்பாலும் எழுந்திருப்பதை நீங்கள் கவனிக்க வேண்டும், ஏனென்றால் பெரிய தரவு ஆதாரங்கள் ஆராய்ச்சி நோக்கத்திற்காக உருவாக்கப்படவில்லை.