2.3 Yhteiset ominaisuudet big data

Big tietolähteet ovat yleensä kymmenen ominaisuudet; jotkut ovat hyviä sosiaalisen tutkimuksen ja jotkut ovat huonoja.

Jos tutkijat ovat menossa oppia suuria tietoja, joita he eivät luo tai kerää, niin heidän on ymmärrettävä sen yleisiä ominaisuuksia. Eikä lähteä konetyypeittäin lähestymistapa (esim tässä mitä tarvitsee tietää viserrys, tässä mitä sinun tarvitsee tietää Googlen hakutietoja, jne), aion kuvata kymmenen yleispiirteet iso tiedot, ominaisuudet, jotka syntyvät koska tietoja ei luotu varten yhteiskunnallisen tutkimuksen. Astumalla takaisin yksityiskohtia kuhunkin järjestelmään ja tarkastelee näitä yleisiä ominaisuuksia, tutkijat voivat nopeasti lisätietoja olemassa olevia tietolähteitä ja on vakaa joukko ideoita soveltaa tuleviin tietolähteitä.

Minusta on hyödyllistä ryhmitellä ominaisuuksien kahteen luokkaan:

  • yleensä hyvä tutkimukseen: iso, aina päällä, ei-reaktiivinen
  • yleensä huono tutkimus: epätäydellinen, saavuttamattomissa, ei-edustaja, drifting, algoritmeilla sekoiteta, saavuttamattomissa, likainen, ja herkkä

Yleisesti ottaen hallitus hallinnolliset asiakirjat ovat vähemmän kuin edustaja, vähemmän algoritmeilla häpeään, ja vähemmän ajautuminen. Toisaalta, liiketoiminnan hallinnolliset asiakirjat ovat yleensä suurempia ja aina päällä.