2.3 Suurten tietojen kymmenen yhteistä ominaisuutta

Suurilla tietolähteillä on usein yhteisiä piirteitä; jotkut ovat yleensä hyviä sosiaaliseen tutkimukseen ja jotkut ovat yleensä huonoja.

Vaikka jokainen suuri tietolähde on erillinen, on hyödyllistä huomata, että tietyillä ominaisuuksilla on taipumus esiintyä uudestaan ​​ja uudestaan. Siksi, sen sijaan, että ottaisit käyttöön platform-by-platform-lähestymistavan (esim. Mitä sinun tarvitsee tietää Twitteristä, tässä on sinun tarvitsee tietää Google-hakutiedoista jne.), Aion kuvata kymmenen suuren tietolähteistä. Kun otetaan huomioon kunkin tietojärjestelmän yksityiskohdat ja tarkastellaan näitä yleisiä ominaisuuksia, tutkijat voivat nopeasti oppia olemassa olevista tietolähteistä ja ottaa käyttöön tiettyjä ideoita tulevaisuudessa luotuihin tietolähteisiin.

Vaikka tietolähteen halutut ominaisuudet riippuvat tutkimuksen tavoitteesta, on mielestäni hyödyllistä ryhmitellä kymmenen ominaisuutta kahteen pääryhmään:

  • yleensä hyödyllisiä tutkimuksille: iso, aina-on, ja ei-reagoiva
  • Yleisesti ongelmallinen tutkimukselle: epätäydellinen, saavuttamaton, ei-edustava, ajelehtiva, algoritmisesti sekava, likainen ja herkkä

Kun kuvataan näitä ominaisuuksia, huomaat, että ne syntyvät usein, koska suuria tietolähteitä ei luotu tutkimusta varten.