2.3 . Lielo datu desmit kopīgas īpašības

Lieliem datu avotiem parasti ir vairākas pazīmes; daži parasti ir piemēroti sociālajiem pētījumiem, un daži no tiem parasti ir slikti.

Kaut arī katrs lielais datu avots ir atšķirīgs, ir lietderīgi atzīmēt, ka pastāv zināmas īpašības, kas parasti notiek atkal un atkal. Tāpēc, nevis izmantojot platformas platformu (piemēram, šeit ir tas, kas jums jāzina par čivināt, šeit ir tas, kas jums jāzina par Google meklēšanas datiem utt.), Es raksturos desmit vispārēju raksturojumu datu avoti. Atkāpjoties no katras konkrētās sistēmas detaļām un ņemot vērā šīs vispārīgās īpašības, pētnieki var ātri uzzināt par esošajiem datu avotiem un izveidot stingru ideju kopumu, kas attiecas uz datu avotiem, kas tiks izveidoti nākotnē.

Kaut arī datu avota vēlamās īpašības ir atkarīgas no pētījuma mērķa, manuprāt, ir lietderīgi desmit īpašības rupji grupēt divās plašās kategorijās:

  • kopumā noderīgi pētniecībai: liela, vienmēr pastāvīga un nereaģējoša
  • pētniecībai parasti ir problemātiska: nepilnīga, nepieejama, nereprezentatīva, dreifējoša, algoritmiski sajaukta, netīra un jutīga

Kā es raksturošu šīs īpašības, jūs ievērosiet, ka tie bieži rodas tāpēc, ka pētījumu nolūkā netika izveidoti lieli datu avoti.