2.3 Sapuluh ciri umum data badag

Sumber data badag condong boga Jumlah ciri di umum; sababaraha umumna alus pikeun panalungtikan sosial sarta sababaraha umumna goréng.

Sanajan unggal sumber data badag béda, éta mantuan mun aya bewara yen aya ciri nu tangtu nu condong lumangsung leuwih sarta leuwih deui. Kituna, tinimbang nyokot pendekatan platform-demi-platform (misalna di dieu naon nu peryogi kauninga ngeunaan Twitter, di dieu naon nu peryogi kauninga ngeunaan data pilarian Google, jsb), Kaula bade nerangkeun sapuluh ciri umum tina badag sumber data. Stepping deui ti rinci unggal sistem tinangtu sarta pilari dina ieu ciri umum nyandak peneliti mun gancang ngalenyepan sumber data aya na boga set teguh gagasan panawaran kana sumber data nu bakal dijieun dina mangsa nu bakal datang.

Sanajan ciri dipikahoyong tina hiji sumber data gumantung kana tujuan panalungtikan, kuring manggihan deui mantuan ka grup crudely sapuluh ciri kana dua kategori lega:

  • umumna mantuan pikeun panalungtikan: badag, salawasna-on, sarta nonreactive
  • umumna masalah pikeun panalungtikan: teu lengkep, inaccessible, nonrepresentative, drifting, algorithmically ngabingungkeun, kotor, jeung sénsitip

Salaku Kuring ngajéntrékeun ciri ieu maneh bakal aya bewara nu aranjeunna mindeng mecenghul lantaran sumber data badag teu dijieun keur kaperluan panalungtikan.