2.3 મોટી માહિતીના દસ સામાન્ય લક્ષણો

મોટા ડેટા સ્રોતમાં ઘણી લાક્ષણિકતાઓ સામાન્ય હોય છે; કેટલાક સામાન્ય રીતે સામાજિક સંશોધન માટે સારા છે અને કેટલાક સામાન્ય રીતે ખરાબ છે.

તેમ છતાં દરેક મોટા ડેટા સ્રોત અલગ છે, તે નોંધવું મદદરૂપ છે કે ત્યાં ચોક્કસ લાક્ષણિકતાઓ છે જે ઉપર અને ઉપર ફરીથી જોવા મળે છે. તેથી, પ્લેટફોર્મ-બાય-પ્લેટફોર્મ અભિગમ લેવાની જગ્યાએ (દા.ત., ટ્વિટર વિશે તમારે જાણવાની આવશ્યકતા છે, અહીં તે છે જે તમને Google શોધ ડેટા વિશે જાણવાની જરૂર છે), હું મોટી દસ સામાન્ય લાક્ષણિક્તાઓનું વર્ણન કરું છું ડેટા સ્ત્રોતો દરેક ચોક્કસ પ્રણાલીની વિગતોમાંથી પાછો ફરવું અને આ સામાન્ય લાક્ષણિકતાઓને જોતાં, સંશોધકોને હાલના ડેટા સ્ત્રોતો વિશે ઝડપથી શીખવા માટે અને ભવિષ્યમાં બનાવવામાં આવશે તે ડેટા સ્રોતો પર લાગુ કરવા માટે વિચારોનો એક પેઢી સેટ છે.

તેમ છતાં ડેટા સ્રોતની ઇચ્છિત લાક્ષણિકતાઓ સંશોધન ધ્યેય પર આધાર રાખે છે, પણ મને દસ લાક્ષણિકતાઓને બે વ્યાપક કેટેગરીમાં ભેળવવામાં મદદરૂપ લાગે છે:

  • સંશોધન માટે સામાન્ય રીતે સહાયરૂપ થાય છે: મોટા, હંમેશા-ચાલુ, અને બિન-સક્રિય
  • સંશોધન માટે સામાન્ય રીતે સમસ્યારૂપ: અપૂર્ણ, અપ્રાપ્ય, અવિનિત, ડ્રિફ્ટિંગ, એલ્ગોરિધમનીલી ગુંચવણભરી, ગંદા અને સંવેદનશીલ

હું આ લાક્ષણિકતાઓનું વર્ણન કરું છું તેમ તમે નોંધ લો છો કે તેઓ વારંવાર ઉદભવે છે કારણ કે સંશોધનના ઉદ્દેશ્ય માટે મોટા ડેટા સ્ત્રોતો બનાવવામાં આવ્યાં નથી.