2.3 Algemene kenmerke van die groot data

Big databronne is geneig om tien eienskappe het; sommige is goed vir sosiale navorsing en 'n paar is sleg.

As navorsers gaan om te leer uit 'n groot data wat hulle nie skep of te samel, dan moet hulle die algemene kenmerke te verstaan. Eerder as om 'n platform deur platform benadering (bv, hier is wat jy nodig het om te weet oor Twitter, hier is wat jy nodig het om te weet oor Google-soektog data, ens), ek gaan tien algemene kenmerke van die groot data, eienskappe wat ontstaan ​​te beskryf omdat die data is nie geskep vir die doel van sosiale navorsing. Deur versterking terug van die besonderhede van elke spesifieke stelsel en kyk na hierdie algemene eienskappe, kan navorsers vinnig leer meer oor bestaande databronne en het 'n vaste stel idees om aansoek te doen om toekomstige data bronne.

Ek vind dit nuttig om groep die eienskappe in twee kategorieë:

  • oor die algemeen goed vir navorsing: groot, altyd-op, nie-reaktiewe
  • oor die algemeen sleg vir navorsing: onvolledig, ontoeganklik, nie-verteenwoordiger, dryf, algoritmies war, ontoeganklik, vuil, en sensitiewe

Breedweg regering administratiewe rekords minder nie-verteenwoordiger, minder algoritmies die skande gekom, en minder dryf. Aan die ander kant, besigheid administratiewe rekords is geneig om groter en meer altyd-op wees.