2.3 ciri umum data gedé

Sumber data Big condong boga sapuluh ciri; sababaraha alus pikeun panalungtikan sosial jeung sababaraha nu goréng.

Lamun panalungtik bade diajar ti data gedé nu teu nyieun atawa ngumpulkeun, mangka maranéhanana kudu ngarti ciri umum anak. Tinimbang nyokot platform ku pendekatan platform (misalna di dieu naon anjeun kudu nyaho ngeunaan Twitter, di dieu naon anjeun kudu nyaho ngeunaan data search Google, jsb), Kaula bade nerangkeun sapuluh ciri umum data gedé, ciri anu timbul sabab data ieu teu dijieun pikeun tujuan panalungtikan sosial. Ku stepping balik ti wincik unggal sistim husus jeung nempo ieu sipat umum, panalungtik bisa gancang leuwih jéntré ngeunaan sumber data aya sarta mibanda susunan teguh gagasan panawaran sumber data nu bakal datang.

Kuring manggihan eta mantuan ka grup ciri kana dua kategori:

  • umumna alus pikeun panalungtikan: gedé, sok-on, non-réaktif
  • umumna bad pikeun panalungtikan: teu lengkep, inaccessible, non-wakil, drifting, algorithmically ngabingungkeun, inaccessible, kotor, jeung sensitip

Sacara lega diomongkeun, rékaman administrasi pamaréntahan kurang non-wakil, kurang algorithmically ngabingungkeun, sarta kurang drifting. Di sisi séjén, rékaman administrasi bisnis condong leuwih badag jeung leuwih sok di.