2.3 Skupne značilnosti velikih podatkov

Big viri podatkov imajo ponavadi deset lastnosti; nekateri so dobri za socialne raziskave in nekateri so slabi.

Če raziskovalci se bodo učili iz velikih podatkov, ki jih niso ustvarili ali zbira, nato pa morajo razumeti njegove splošne značilnosti. Namesto da bi platformo s pristopom platforme (npr, tukaj je tisto, kar morate vedeti o Twitterju, tukaj je tisto, kar morate vedeti o Google iskanja podatkov, itd), bom opisati deset splošnih značilnosti velikih podatkov, značilnosti, ki se pojavljajo ker podatki niso bila ustvarjena za socialne raziskave. Ga opazujemo podrobnosti vsakega posameznega sistema in pogledu na te splošne lastnosti, lahko raziskovalci hitro izvedeti več o obstoječih podatkovnih virov in imajo trdno nabor idej za prihodnja podatkovnih virov.

Se mi zdi koristno, da skupino značilnosti v dve kategoriji:

  • na splošno dobra za raziskave: velik, vedno-na, non-reaktivnega
  • na splošno slabo za raziskave: nepopolnega, nedostopni, non-zastopnik, viseče, z algoritmom osramočen, nedostopna, umazana, in občutljiva

Na splošno vlada administrativne evidence manj niso reprezentativne, manj algoritmom utišala, in manj viseče. Po drugi strani, poslovnih administrativne evidence ponavadi večji in bolj vedno-na.