2.3 közös jellemzői a nagy adat

Big adatforrások általában tíz jellemzői; Néhány jó a társadalomkutatás és néhány rossz.

Ha a kutatók fognak tanulni a nagy adat, hogy nem hoz létre vagy gyűjt, akkor meg kell érteni a gazdaság általános jellemzői. Ahelyett, hogy platformonkénti megközelítés (pl itt van, mit kell tudni a Twitter, itt van, mit kell tudni a Google keresési adatokat, stb), fogok leírni tíz általános jellemzői a nagy adatok, jellemzők, hogy a felmerülő mivel az adatok nem jött létre abból a célból, szociális kutatás. By visszalépve az adatait minden egyes rendszerbe, és nézi ezeket az általános tulajdonságokat, a kutatók gyorsan többet meglévő adatforrások és van egy szilárd felvetéseket is alkalmazni kell a jövőbeli adatforrások.

Nekem sokat segít, hogy csoportosítsa a jellemzők két csoportba sorolhatók:

  • általában jó kutatási: nagy, always-on, nem reaktív
  • általában rossz kutatási: hiányos, megközelíthetetlen, nem reprezentatív, sodródó, algoritmikusan keveredett, megközelíthetetlen, piszkos, és érzékeny

Általánosságban elmondható, hogy a kormány a közigazgatási nyilvántartások kevésbé nem reprezentatív, kevésbé algoritmikusan megszégyenül, és kevésbé sodródik. Másrészt, az üzleti adminisztratív nyilvántartások általában nagyobb és mindig-on.