2.3 Tien algemene eienskappe van groot data

Groot databronne is geneig om 'n aantal eienskappe in gemeen te hê; sommige is oor die algemeen goed vir sosiale navorsing en sommige is oor die algemeen sleg.

Alhoewel elke groot databron onderskei is, is dit nuttig om op te let dat daar sekere eienskappe is wat oor en oor voorkom. Daarom, eerder as om 'n platform-vir-platform-benadering te gebruik (soos hier is wat jy oor Twitter moet weet, hier is wat jy moet weet oor Google se soekdata, ens.), Sal ek tien algemene eienskappe van groot data bronne. Deur terug te keer na die besonderhede van elke spesifieke stelsel en na hierdie algemene eienskappe te kyk, kan navorsers vinnig oor bestaande databronne leer en 'n stewige stel idees hê om aansoek te doen vir die databronne wat in die toekoms geskep sal word.

Alhoewel die verlangde eienskappe van 'n databron afhang van die navorsingsdoel, vind ek dit nuttig om die tien eienskappe in twee breë kategorieë te groepeer:

  • algemeen nuttig vir navorsing: groot, altyd-op, en nie-reaktief
  • oor die algemeen problematies vir navorsing: onvolledig, ontoeganklik, nie verteenwoordigend, dryfend, algoritmies beskaamd, vuil en sensitief

Soos ek hierdie eienskappe beskryf, sal jy sien dat hulle dikwels ontstaan ​​omdat groot databronne nie vir die doel van navorsing geskep is nie.